Python3标准库glob文件名模式匹配的问题


Posted in Python onMarch 13, 2020

1. glob文件名模式匹配

尽管glob API很小,但这个模块的功能却很强大。只要程序需要查找文件系统中名字与某个模式匹配的一组文件,就可以使用这个模块。要创建一个文件名列表,要求其中各个文件名都有某个特定的扩展名、前缀或者中间都有某个共同的字符串,就可以使用glob而不用编写定制代码来扫描目录内容。

glob的模式规则与re模块使用的正则表达式并不相同。实际上,glob的模式遵循标准UNIX路径扩展规则。只使用几个特殊字符来实现两个不同的通配符和字符区间。模式规则应用于文件名中的段(在路径分隔符/处截止)。

1.1 实例数据

本节中的示例假定当前工作目录中存在以下测试文件。

test_files
test_files/file.txt
test_files/file1.txt
test_files/file2.txt
test_files/filea.txt
test_files/fileb.txt
test_files/subfiles
test_files/subfiles/subfile.txt

如果这些文件不存在,请glob_maketestdata.py在运行以下示例之前使用示例代码创建它们。

Python3标准库glob文件名模式匹配的问题

1.2 通配符

星号(*)匹配一个文件名段中的0个或多个字符。例如,test_files/*。

import glob
for name in sorted(glob.glob('test_files/*')):
  print(name)

这个模式会匹配目录test_files中的所有路径名(文件或目录),但不会进一步递归搜索到子目录。glob()返回的数据不会排序,所以这里的实例会进行排序以便研究结果。

Python3标准库glob文件名模式匹配的问题

要列出子目录中的文件,必须把子目录包含在模式中。

import glob
print('Named explicitly:')
for name in sorted(glob.glob('test_files/subfiles/*')):
  print(' {}'.format(name))
print('Named with wildcard:')
for name in sorted(glob.glob('test_files/*/*')):
  print(' {}'.format(name))

前面显示的第一种情况显式列出了子目录名,第二种情况则依赖一个通配符来查找目录。

Python3标准库glob文件名模式匹配的问题

在这里,两种做法的结果是一样的。如果还有另一个子目录,则通配符会匹配这两个子目录,并且两个子目录中的文件名都会出现在结果中。

1.3 单字符通配符

问号(?)也是一个通配符。它会匹配文件名中该位置的单个字符。

import glob
for name in sorted(glob.glob('test_files/file?.txt')):
  print(name)

前面的例子会匹配以file开头,然后是另外一个任意字符,最后以.txt结尾的所有文件名。

Python3标准库glob文件名模式匹配的问题

1.4 字符区间

如果使用字符区间([a-z])而不是问号,则可以匹配多个字符中的一个字符。下面这个例子会查找名字中扩展名前有一个数字的所有文件。

import glob
for name in sorted(glob.glob('test_files/*[0-9].*')):
  print(name)

字符区间[0-9]会匹配所有单个数字。区间根据各字母/数字的字符码排序,短横线指示连续字符组成的一个不间断区间。这个区间值也可以写为[0123456789]。

Python3标准库glob文件名模式匹配的问题

1.5 转义元字符

有时有必要搜索名字中包含一些特殊元字符的文件,glob使用这些特殊元字符表示模式。escape()函数会建立一个适合的模式,其中的特殊字符会被“转义”,使它们不会被glob扩展或解释为特殊字符。

import glob
specials = '?*['
for char in specials:
  pattern = 'test_files/*' + glob.escape(char) + '.txt'
  print('Searching for: {!r}'.format(pattern))
  for name in sorted(glob.glob(pattern)):
    print(name)
  print()

可以通过构建一个包含单个元素的字符区间来转义各个特殊字符。

Python3标准库glob文件名模式匹配的问题

总结

到此这篇关于Python3标准库glob文件名模式匹配的问题的文章就介绍到这了,更多相关python glob 文件名匹配内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
Python 抓取动态网页内容方案详解
Dec 25 Python
Python装饰器使用示例及实际应用例子
Mar 06 Python
python实现带声音的摩斯码翻译实现方法
May 20 Python
Mac中升级Python2.7到Python3.5步骤详解
Apr 27 Python
python PyTorch参数初始化和Finetune
Feb 11 Python
使用pycharm生成代码模板的实例
May 23 Python
Python清空文件并替换内容的实例
Oct 22 Python
详解python数据结构和算法
Apr 18 Python
通过实例解析python描述符原理作用
Jan 22 Python
keras读取训练好的模型参数并把参数赋值给其它模型详解
Jun 15 Python
Python建造者模式案例运行原理解析
Jun 29 Python
如何基于Python Matplotlib实现网格动画
Jul 20 Python
python编写俄罗斯方块
Mar 13 #Python
探秘TensorFlow 和 NumPy 的 Broadcasting 机制
Mar 13 #Python
自定义Django Form中choicefield下拉菜单选取数据库内容实例
Mar 13 #Python
django处理select下拉表单实例(从model到前端到post到form)
Mar 13 #Python
python实现俄罗斯方块游戏(改进版)
Mar 13 #Python
Python之Django自动实现html代码(下拉框,数据选择)
Mar 13 #Python
Tensorflow中的dropout的使用方法
Mar 13 #Python
You might like
php从右向左/从左向右截取字符串的实现方法
2011/11/28 PHP
PHP数组传递是值传递而非引用传递概念纠正
2013/01/31 PHP
php模拟post提交数据的方法
2015/02/12 PHP
php注册系统和使用Xajax即时验证用户名是否被占用
2017/08/31 PHP
PHP实现一个轻量级容器的方法
2019/01/28 PHP
解决Laravel5.x的php artisan migrate数据库迁移创建操作报错SQLSTATE[42000]
2020/04/06 PHP
List the Codec Files on a Computer
2007/06/18 Javascript
判断浏览器的javascript版本的代码
2010/09/03 Javascript
如何使用JS获取IE上传文件路径(IE7,8)
2013/07/08 Javascript
jquery 单引号和双引号的区别及使用注意
2013/07/31 Javascript
js简单实现交换Li的值
2014/05/22 Javascript
Angular Js文件上传之form-data
2015/08/28 Javascript
JS & JQuery 动态添加 select option
2016/06/08 Javascript
JavaScript实现使用Canvas绘制图形的基本教程
2016/10/27 Javascript
jQuery+ajax的资源回收处理机制分析
2017/01/07 Javascript
超全面的javascript中变量命名规则
2017/02/09 Javascript
微信JSAPI Ticket接口签名详解
2020/06/28 Javascript
基于node下的http小爬虫的示例代码
2018/01/11 Javascript
[54:29]2018DOTA2亚洲邀请赛 4.7 淘汰赛 VP vs LGD 第二场
2018/04/09 DOTA
基于python(urlparse)模板的使用方法总结
2017/10/13 Python
使用Python实现windows下的抓包与解析
2018/01/15 Python
Python实现的生成格雷码功能示例
2018/01/24 Python
python创造虚拟环境方法总结
2019/03/04 Python
命令行运行Python脚本时传入参数的三种方式详解
2019/10/11 Python
python Plotly绘图工具的简单使用
2020/03/03 Python
Python稀疏矩阵及参数保存代码实现
2020/04/18 Python
Python使用Numpy模块读取文件并绘制图片
2020/05/13 Python
python爬虫中url管理器去重操作实例
2020/11/30 Python
草莓网英国官网:Strawberrynet UK
2017/02/12 全球购物
清洁工表扬信
2014/01/08 职场文书
问卷调查计划书
2014/01/10 职场文书
承办会议欢迎词
2014/01/17 职场文书
乔丹名人堂演讲稿
2014/05/24 职场文书
技术员个人工作总结
2015/03/03 职场文书
学校团代会开幕词
2016/03/04 职场文书
读鲁迅先生的经典名言
2019/08/20 职场文书