Python3标准库glob文件名模式匹配的问题


Posted in Python onMarch 13, 2020

1. glob文件名模式匹配

尽管glob API很小,但这个模块的功能却很强大。只要程序需要查找文件系统中名字与某个模式匹配的一组文件,就可以使用这个模块。要创建一个文件名列表,要求其中各个文件名都有某个特定的扩展名、前缀或者中间都有某个共同的字符串,就可以使用glob而不用编写定制代码来扫描目录内容。

glob的模式规则与re模块使用的正则表达式并不相同。实际上,glob的模式遵循标准UNIX路径扩展规则。只使用几个特殊字符来实现两个不同的通配符和字符区间。模式规则应用于文件名中的段(在路径分隔符/处截止)。

1.1 实例数据

本节中的示例假定当前工作目录中存在以下测试文件。

test_files
test_files/file.txt
test_files/file1.txt
test_files/file2.txt
test_files/filea.txt
test_files/fileb.txt
test_files/subfiles
test_files/subfiles/subfile.txt

如果这些文件不存在,请glob_maketestdata.py在运行以下示例之前使用示例代码创建它们。

Python3标准库glob文件名模式匹配的问题

1.2 通配符

星号(*)匹配一个文件名段中的0个或多个字符。例如,test_files/*。

import glob
for name in sorted(glob.glob('test_files/*')):
  print(name)

这个模式会匹配目录test_files中的所有路径名(文件或目录),但不会进一步递归搜索到子目录。glob()返回的数据不会排序,所以这里的实例会进行排序以便研究结果。

Python3标准库glob文件名模式匹配的问题

要列出子目录中的文件,必须把子目录包含在模式中。

import glob
print('Named explicitly:')
for name in sorted(glob.glob('test_files/subfiles/*')):
  print(' {}'.format(name))
print('Named with wildcard:')
for name in sorted(glob.glob('test_files/*/*')):
  print(' {}'.format(name))

前面显示的第一种情况显式列出了子目录名,第二种情况则依赖一个通配符来查找目录。

Python3标准库glob文件名模式匹配的问题

在这里,两种做法的结果是一样的。如果还有另一个子目录,则通配符会匹配这两个子目录,并且两个子目录中的文件名都会出现在结果中。

1.3 单字符通配符

问号(?)也是一个通配符。它会匹配文件名中该位置的单个字符。

import glob
for name in sorted(glob.glob('test_files/file?.txt')):
  print(name)

前面的例子会匹配以file开头,然后是另外一个任意字符,最后以.txt结尾的所有文件名。

Python3标准库glob文件名模式匹配的问题

1.4 字符区间

如果使用字符区间([a-z])而不是问号,则可以匹配多个字符中的一个字符。下面这个例子会查找名字中扩展名前有一个数字的所有文件。

import glob
for name in sorted(glob.glob('test_files/*[0-9].*')):
  print(name)

字符区间[0-9]会匹配所有单个数字。区间根据各字母/数字的字符码排序,短横线指示连续字符组成的一个不间断区间。这个区间值也可以写为[0123456789]。

Python3标准库glob文件名模式匹配的问题

1.5 转义元字符

有时有必要搜索名字中包含一些特殊元字符的文件,glob使用这些特殊元字符表示模式。escape()函数会建立一个适合的模式,其中的特殊字符会被“转义”,使它们不会被glob扩展或解释为特殊字符。

import glob
specials = '?*['
for char in specials:
  pattern = 'test_files/*' + glob.escape(char) + '.txt'
  print('Searching for: {!r}'.format(pattern))
  for name in sorted(glob.glob(pattern)):
    print(name)
  print()

可以通过构建一个包含单个元素的字符区间来转义各个特殊字符。

Python3标准库glob文件名模式匹配的问题

总结

到此这篇关于Python3标准库glob文件名模式匹配的问题的文章就介绍到这了,更多相关python glob 文件名匹配内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python实现将文本转换成语音的方法
May 28 Python
python中关于for循环的碎碎念
Jun 30 Python
tensorflow更改变量的值实例
Jul 30 Python
在pycharm中设置显示行数的方法
Jan 16 Python
Python3实现的反转单链表算法示例
Mar 08 Python
Django中reverse反转并且传递参数的方法
Aug 06 Python
vue常用指令代码实例总结
Mar 16 Python
Python第三方包之DingDingBot钉钉机器人
Apr 09 Python
什么是python的id函数
Jun 11 Python
全面介绍python中很常用的单元测试框架unitest
Dec 14 Python
Python 调用C++封装的进一步探索交流
Mar 04 Python
如何使用Tkinter进行窗口的管理与设置
Jun 30 Python
python编写俄罗斯方块
Mar 13 #Python
探秘TensorFlow 和 NumPy 的 Broadcasting 机制
Mar 13 #Python
自定义Django Form中choicefield下拉菜单选取数据库内容实例
Mar 13 #Python
django处理select下拉表单实例(从model到前端到post到form)
Mar 13 #Python
python实现俄罗斯方块游戏(改进版)
Mar 13 #Python
Python之Django自动实现html代码(下拉框,数据选择)
Mar 13 #Python
Tensorflow中的dropout的使用方法
Mar 13 #Python
You might like
一个用mysql_odbc和php写的serach数据库程序
2006/10/09 PHP
通过缓存数据库结果提高PHP性能的原理介绍
2012/09/05 PHP
PHP取整函数:ceil,floor,round,intval的区别详细解析
2013/08/31 PHP
php中怎么搜索相关联数组键值及获取之
2013/10/17 PHP
thinkphp 5框架实现登陆,登出及session登陆状态检测功能示例
2019/10/10 PHP
VSCode+PHPstudy配置PHP开发环境的步骤详解
2020/08/20 PHP
HTML中的setCapture和releaseCapture使用介绍
2012/03/21 Javascript
jQuery.prototype.init选择器构造函数源码思路分析
2013/02/05 Javascript
跨域传值即主页面与iframe之间互相传值
2013/12/09 Javascript
document.forms[].submit()使用介绍
2014/02/19 Javascript
JavaScript定义类和对象的方法
2014/11/26 Javascript
JavaScript实现网页加载进度条代码超简单
2015/09/21 Javascript
Ajax高级笔记 JavaScript高级程序设计笔记
2017/06/22 Javascript
Angular2环境搭建具体操作步骤(推荐)
2017/08/04 Javascript
基于js文件加载优化(详解)
2018/01/03 Javascript
Vue的土著指令和自定义指令实例详解
2018/02/04 Javascript
Nuxt.js实现校验访问浏览器类型的中间件
2018/08/24 Javascript
angular多语言配置详解
2019/05/16 Javascript
vue表单数据交互提交演示教程
2019/11/13 Javascript
Vue 的双向绑定原理与用法揭秘
2020/05/06 Javascript
基于JS实现table导出Excel并保留样式
2020/05/19 Javascript
小程序实现上传视频功能
2020/08/18 Javascript
Django框架中方法的访问和查找
2015/07/15 Python
Python代码解决RenderView窗口not found问题
2016/08/28 Python
python中的随机函数小结
2018/01/27 Python
python selenium 查找隐藏元素 自动播放视频功能
2019/07/24 Python
使用tqdm显示Python代码执行进度功能
2019/12/08 Python
利用CSS3实现单选框动画特效示例代码
2016/09/26 HTML / CSS
会计专业自我鉴定范文
2013/12/29 职场文书
终止或解除劳动合同及劳动关系的证明书
2014/10/06 职场文书
大学生违纪检讨书300字
2014/10/25 职场文书
2015年党风廉政建设责任书
2015/01/29 职场文书
电影雨中的树观后感
2015/06/15 职场文书
未婚证明范本
2015/06/15 职场文书
十大冰系宝可梦排名,颜值最高的阿罗拉九尾,第三使用率第一
2022/03/18 日漫
Java字符串逆序方法详情
2022/03/21 Java/Android