Python中fnmatch模块的使用详情


Posted in Python onNovember 30, 2018

fnamtch就是filenamematch, 在python中利用符合linuxshell风格的匹配模块来进行文件名的匹配筛选工作。

fnmatch()函数匹配能力介于简单的字符串方法和强大的正则表达式之间,如果在数据处理操作中只需要简单的通配符就能完成的时候,这通常是一个比较合理的方案。此模块的主要作用是文件名称的匹配,并且匹配的模式使用的Unix shell风格。源码很简单:

"""Filename matching with shell patterns.

fnmatch(FILENAME, PATTERN) matches according to the local convention.
fnmatchcase(FILENAME, PATTERN) always takes case in account.

The functions operate by translating the pattern into a regular
expression. They cache the compiled regular expressions for speed.

The function translate(PATTERN) returns a regular expression
corresponding to PATTERN. (It does not compile it.)
"""
import os
import posixpath
import re
import functools

__all__ = ["filter", "fnmatch", "fnmatchcase", "translate"]

def fnmatch(name, pat):
  """Test whether FILENAME matches PATTERN.

  Patterns are Unix shell style:

  *    matches everything
  ?    matches any single character
  [seq]  matches any character in seq
  [!seq] matches any char not in seq

  An initial period in FILENAME is not special.
  Both FILENAME and PATTERN are first case-normalized
  if the operating system requires it.
  If you don't want this, use fnmatchcase(FILENAME, PATTERN).
  """
  name = os.path.normcase(name)
  pat = os.path.normcase(pat)
  return fnmatchcase(name, pat)

@functools.lru_cache(maxsize=256, typed=True)
def _compile_pattern(pat):
  if isinstance(pat, bytes):
    pat_str = str(pat, 'ISO-8859-1')
    res_str = translate(pat_str)
    res = bytes(res_str, 'ISO-8859-1')
  else:
    res = translate(pat)
  return re.compile(res).match

def filter(names, pat):
  """Return the subset of the list NAMES that match PAT."""
  result = []
  pat = os.path.normcase(pat)
  match = _compile_pattern(pat)
  if os.path is posixpath:
    # normcase on posix is NOP. Optimize it away from the loop.
    for name in names:
      if match(name):
        result.append(name)
  else:
    for name in names:
      if match(os.path.normcase(name)):
        result.append(name)
  return result

def fnmatchcase(name, pat):
  """Test whether FILENAME matches PATTERN, including case.

  This is a version of fnmatch() which doesn't case-normalize
  its arguments.
  """
  match = _compile_pattern(pat)
  return match(name) is not None


def translate(pat):
  """Translate a shell PATTERN to a regular expression.

  There is no way to quote meta-characters.
  """

  i, n = 0, len(pat)
  res = ''
  while i < n:
    c = pat[i]
    i = i+1
    if c == '*':
      res = res + '.*'
    elif c == '?':
      res = res + '.'
    elif c == '[':
      j = i
      if j < n and pat[j] == '!':
        j = j+1
      if j < n and pat[j] == ']':
        j = j+1
      while j < n and pat[j] != ']':
        j = j+1
      if j >= n:
        res = res + '\\['
      else:
        stuff = pat[i:j].replace('\\','\\\\')
        i = j+1
        if stuff[0] == '!':
          stuff = '^' + stuff[1:]
        elif stuff[0] == '^':
          stuff = '\\' + stuff
        res = '%s[%s]' % (res, stuff)
    else:
      res = res + re.escape(c)
  return r'(?s:%s)\Z' % res

fnmatch的中的5个函数["filter", "fnmatch", "fnmatchcase", "translate"]

filter 返回列表形式的结果

def gen_find(filepat, top):
  """
  查找符合Shell正则匹配的目录树下的所有文件名
  :param filepat: shell正则
  :param top: 目录路径
  :return: 文件绝对路径生成器
  """
  for path, _, filenames in os.walk(top):
    for file in fnmatch.filter(filenames, filepat):
      yield os.path.join(path, file)

fnmatch

# 列出元组中所有的python文件
pyfiles = [py for py in ('restart.py', 'index.php', 'file.txt') if fnmatch(py, '*.py')]
# 字符串的 startswith() 和 endswith() 方法对于过滤一个目录的内容也是很有用的

fnmatchcase 区分大小写的文件匹配

# 这两个函数通常会被忽略的一个特性是在处理非文件名的字符串时候它们也是很有用的。 比如,假设你有一个街道地址的列表数据
address = [
  '5412 N CLARK ST',
  '1060 W ADDISON ST',
  '1039 W GRANVILLE AVE',
  '2122 N CLARK ST',
  '4802 N BROADWAY',
]
print([addr for addr in address if fnmatchcase(addr, '* ST')])

translate 这个似乎很少有人用到,前面说了fnmatch是Unix shell匹配风格,可以使用translate将其转换为正则表达式,举个栗子

shell_match = 'Celery_?*.py'
print(translate(shell_match))
# 输出结果:(?s:Celery_..*\.py)\Z

Celery_..*\.py就是正则表达式的写法。

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python中的异常处理学习笔记
Jan 28 Python
Python基于numpy灵活定义神经网络结构的方法
Aug 19 Python
在Pandas中给多层索引降级的方法
Nov 16 Python
python3使用pandas获取股票数据的方法
Dec 22 Python
selenium2.0中常用的python函数汇总
Aug 05 Python
Python 根据日志级别打印不同颜色的日志的方法示例
Aug 08 Python
在Python中用GDAL实现矢量对栅格的切割实例
Mar 11 Python
ansible-playbook实现自动部署KVM及安装python3的详细教程
May 11 Python
Keras中 ImageDataGenerator函数的参数用法
Jul 03 Python
python文件排序的方法总结
Sep 13 Python
java字符串格式化输出实例讲解
Jan 06 Python
Python机器学习算法之决策树算法的实现与优缺点
May 13 Python
pycharm 解除默认unittest模式的方法
Nov 30 #Python
配置 Pycharm 默认 Test runner 的图文教程
Nov 30 #Python
基于python实现名片管理系统
Nov 30 #Python
django小技巧之html模板中调用对象属性或对象的方法
Nov 30 #Python
PyCharm鼠标右键不显示Run unittest的解决方法
Nov 30 #Python
python实现简单名片管理系统
Nov 30 #Python
python3学生名片管理v2.0版
Nov 29 #Python
You might like
如何将数据从文本导入到mysql
2006/10/09 PHP
PHP中MVC模式的模板引擎开发经验分享
2011/03/23 PHP
php smarty截取中文字符乱码问题?gb2312/utf-8
2011/11/07 PHP
ThinkPHP3.1新特性之查询条件预处理简介
2014/06/19 PHP
修改destoon会员公司的伪静态中的com目录的方法
2014/08/21 PHP
PHP制作3D扇形统计图以及对图片进行缩放操作实例
2014/10/23 PHP
PHP伪造来源HTTP_REFERER的方法实例详解
2015/07/06 PHP
PHP中spl_autoload_register()函数用法实例详解
2016/07/18 PHP
php获取客户端IP及URL的方法示例
2017/02/03 PHP
Yii框架where查询用法实例分析
2019/10/22 PHP
解决jquery插件冲突的问题
2014/01/23 Javascript
javascript中数组array及string的方法总结
2014/11/28 Javascript
jQuery中size()方法用法实例
2014/12/27 Javascript
JQuery Ajax WebService传递参数的简单实例
2016/11/02 Javascript
使用travis-ci如何持续部署node.js应用详解
2017/07/30 Javascript
Vue 进入/离开动画效果
2017/12/26 Javascript
从理论角度讨论JavaScript闭包
2019/04/03 Javascript
JavaScript前端开发时数值运算的小技巧
2020/07/28 Javascript
[43:47]完美世界DOTA2联赛PWL S3 LBZS vs Phoenix 第一场 12.09
2020/12/11 DOTA
简单了解Python matplotlib线的属性
2019/06/29 Python
python3用urllib抓取贴吧邮箱和QQ实例
2020/03/10 Python
Python ATM功能实现代码实例
2020/03/19 Python
pandas 像SQL一样使用WHERE IN查询条件说明
2020/06/05 Python
微信html5页面调用第三方位置导航的示例
2018/03/14 HTML / CSS
英国在线珠宝店:The Jewel Hut
2017/03/20 全球购物
英国最大的宠物商店:Pets at Home
2019/04/17 全球购物
香港百佳网上超级市场:PARKNSHOP.com
2020/06/10 全球购物
给定一个时间点,希望得到其他时间点
2013/11/07 面试题
优秀学生事迹材料
2014/02/08 职场文书
珍惜水资源建议书
2014/03/12 职场文书
幼儿发展评估方案
2014/06/11 职场文书
机关领导查摆四风思想汇报
2014/09/13 职场文书
自主招生学校推荐信范文
2015/03/26 职场文书
工作犯错保证书
2015/05/11 职场文书
什么是求职信?求职信应包含哪些内容?
2019/08/14 职场文书
pytorch中[..., 0]的用法说明
2021/05/20 Python