Python 获取指定文件夹下的目录和文件的实现


Posted in Python onAugust 30, 2019

经常有需要扫描目录,对文件做批量处理的需求,所以对目录处理这块做了下学习和总结。Python 中扫描目录有两种方法:os.listdir 和 os.walk。

一、os.listdir 方法

os.listdir() 方法用于返回指定的目录下包含的文件或子目录的名字的列表。这个列表以字母顺序。其得到的是仅当前路径下的文件名,不包括子目录中的文件,如果需要得到所有文件需要递归。 它也不包括 '.' 和 '..' 即使它在目录中。

语法格式如下:

os.listdir(path)

实例代码

def list_dir(file_dir):
  '''
    通过 listdir 得到的是仅当前路径下的文件名,不包括子目录中的文件,如果需要得到所有文件需要递归
  '''
  print'\n\n<><><><><><> listdir <><><><><><>'
  print "current dir : {0}".format(file_dir)
  dir_list = os.listdir(file_dir)
  for cur_file in dir_list:
    # 获取文件的绝对路径
    path = os.path.join(file_dir, cur_file)
    if os.path.isfile(path): # 判断是否是文件还是目录需要用绝对路径
      print "{0} : is file!".format(cur_file)
    if os.path.isdir(path):
      print "{0} : is dir!".format(cur_file)
      list_dir(path) # 递归子目录

二、os.walk 方法

os.walk() 方法用于通过在目录树中游走输出在目录中的文件名,向上或者向下。是一个简单易用的文件、目录遍历器,可以帮助我们高效的处理文件、目录方面的事情。

语法格式如下:

os.walk(top[, topdown=True[, onerror=None[, followlinks=False]]])

方法参数说明:

  • top:要遍历的目录的路径
  • topdown:可选,如果为 True,则优先遍历 top 目录,以及 top 目录下的每一个子目录,否则优先遍历 top 的子目录,默认为 True
  • onerror: 可选, 需要一个 callable 对象,当 walk 异常时调用
  • followlinks:可选, 如果为 True,则会遍历目录下的快捷方式(linux 下是 symbolic link)实际所指的目录,默认为 False
  • args:包含那些没有 '-' 或 '--' 的参数列表

返回值: 三元组 (root, dirs, files)

  • root :所指的是当前正在遍历的目录的地址
  • dirs :当前文件夹中所有目录名字的 list (不包括子目录)
  • files :当前文件夹中所有的文件 (不包括子目录中的文件)

实例

def work_dir(file_dir):
  print'\n\n<><><><><> work dir <><><><><>'
  for root, dirs, files in os.walk(file_dir):
    print'\n========================================'
    print "root : {0}".format(root)
    print "dirs : {0}".format(dirs)
    print "files : {0}".format(files)
​
    for file in files:
      try:
        print'-----------------------------------'
        
        file_name = os.path.splitext(file)[0]
        file_suffix = os.path.splitext(file)[1]
        file_path = os.path.join(root, file)
        file_abs_path = os.path.abspath(file)
        file_parent = os.path.dirname(file_path)
​
        print "file : {0}".format(file)
        print "file_name : {0}".format(file_name)
        print "file_suffix : {0}".format(file_suffix)
        print "file_path : {0}".format(file_path)
        print "file_abs_path : {0}".format(file_abs_path)
        print "file_parent : {0}".format(file_parent)
        
      except Exception, e:
        print "Exception", e

三、其他跟文件相关的常用方法

os.path.splitext():分离文件名和扩展名

file = "file_test.txt"
file_name = os.path.splitext(file)[0] # 输出:file_test
file_suffix = os.path.splitext(file)[1] # 输出:.txt

os.path.exists():判断文件或目录是否存在

os.path.isfile():判断是否是文件

os.path.isdir():判断是否是目录

os.path.dirname():获取当前文件所在的目录,即父目录

os.makedirs():创建多级目录

os.mkdir():创建单级目录

os.path.getsize():获取文件大小

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python的Django框架中模板碎片缓存简介
Jul 24 Python
python数据类型_字符串常用操作(详解)
May 30 Python
python如何派生内置不可变类型并修改实例化行为
Mar 21 Python
django使用LDAP验证的方法示例
Dec 10 Python
对python中的控制条件、循环和跳出详解
Jun 24 Python
python opencv捕获摄像头并显示内容的实现
Jul 11 Python
python @classmethod 的使用场合详解
Aug 23 Python
django框架中ajax的使用及避开CSRF 验证的方式详解
Dec 11 Python
python分别打包出32位和64位应用程序
Feb 18 Python
使用Python matplotlib作图时,设置横纵坐标轴数值以百分比(%)显示
May 16 Python
深入了解Python装饰器的高级用法
Aug 13 Python
python脚本框架webpy模板赋值实现
Nov 20 Python
简单的Python调度器Schedule详解
Aug 30 #Python
详解在Python中以绝对路径或者相对路径导入文件的方法
Aug 30 #Python
Django使用uwsgi部署时的配置以及django日志文件的处理方法
Aug 30 #Python
Python matplotlib生成图片背景透明的示例代码
Aug 30 #Python
Python 批量刷博客园访问量脚本过程解析
Aug 30 #Python
快速解决docker-py api版本不兼容的问题
Aug 30 #Python
Python 使用 Pillow 模块给图片添加文字水印的方法
Aug 30 #Python
You might like
全国FM电台频率大全 - 21 海南省
2020/03/11 无线电
PHP 变量类型的强制转换
2009/10/23 PHP
Javascript实现CheckBox的全选与取消全选的代码
2010/07/20 Javascript
jquery post方式传递多个参数值后台以数组的方式进行接收
2013/01/11 Javascript
jquery.validate的使用说明介绍
2013/11/12 Javascript
开发插件的两个方法jquery.fn.extend与jquery.extend
2013/11/21 Javascript
js substring从右边获取指定长度字符串(示例代码)
2013/12/23 Javascript
在jquery中combobox多选的不兼容问题总结
2013/12/24 Javascript
javascript:void(0)点击登录没反应怎么解决
2015/11/13 Javascript
WordPress中利用AJAX技术进行评论提交的实现示例
2016/01/12 Javascript
浅谈js和css内联外联注意事项
2016/06/30 Javascript
Bootstrap零基础入门教程(二)
2016/07/18 Javascript
JavaScript实现弹窗效果代码分析
2017/03/09 Javascript
jQuery实现鼠标滑过预览图片大图效果的方法
2017/04/26 jQuery
Angualrjs 表单验证的两种方式(失去焦点验证和点击提交验证)
2017/05/09 Javascript
详解基于webpack搭建react运行环境
2017/06/01 Javascript
JS开发常用工具函数(小结)
2019/07/04 Javascript
js回溯法计算最佳旅行线路代码实例
2019/09/11 Javascript
怎么理解wx.navigateTo的events参数使用详情
2020/05/18 Javascript
javascript实现移动端触屏拖拽功能
2020/07/29 Javascript
关于IDEA中的.VUE文件报错 Export declarations are not supported by current JavaScript version
2020/10/17 Javascript
[01:14]辉夜杯战队访谈宣传片—NEWBEE.Y
2015/12/26 DOTA
python BeautifulSoup使用方法详解
2013/11/21 Python
Python实现Logger打印功能的方法详解
2017/09/01 Python
Keras: model实现固定部分layer,训练部分layer操作
2020/06/28 Python
Python实现Kerberos用户的增删改查操作
2020/12/14 Python
Office DEPOT法国官网:欧迪办公用品采购
2018/01/03 全球购物
客服专员岗位职责范本
2013/11/29 职场文书
煤矿安全知识竞赛活动总结
2014/07/07 职场文书
奥巴马上海演讲稿
2014/09/10 职场文书
典型事迹材料范文
2014/12/29 职场文书
公司人力资源管理制度
2015/08/05 职场文书
用php如何解决大文件分片上传问题
2021/07/07 PHP
JavaScript小技巧带你提升你的代码技能
2021/09/15 Javascript
Redis命令处理过程源码解析
2022/02/12 Redis
SpringBoot中获取profile的方法详解
2022/04/08 Java/Android