python遍历文件目录、批量处理同类文件


Posted in Python onAugust 31, 2019

本文实例为大家分享了python遍历文件目录、批量处理同类文件的具体代码,供大家参考,具体内容如下

目录操作

1、获取当前目录

import os
curr_path=os.path.dirname(__file__) #返回当前文件所在的目录,即当前运行的脚本所在父目录
print curr_path

运行示例

python遍历文件目录、批量处理同类文件

(1)使用os.path.dirname(__file__)时,是针对运行时对所给程序脚本的路径来获取父目录的,即截取你输入的脚本路径的所在目录名称,如上图示例,输入绝对路径时返回绝对路径,输入相对路径时返回相对路径,如果只输入了脚本名称,则返回空。

注:当从命令行中进入python环境时时,参数__file__不能使用)

(2)当直接使用os.path.dirname(“/home/test_MK/test.py”)时,直接返回“/home/test_MK”

2、获取目录文件列表

file_list=os.listdir("/home/test_MK/test")) 
print file_list

运行示例

python遍历文件目录、批量处理同类文件python遍历文件目录、批量处理同类文件

3、获取该目录下文件夹或者文件列表

path="/home/test_MK/test"
objects=os.listdir(path)
dir_list=[] #存放目录列表
file_list=[] #存放文件列表
for obj in objects:
 if os.path.isdir(os.path.join(path, obj)):#判断是否是目录os.path.join()用来将路径拼接
 dir_list.append(os.path.join(path, obj))#保存时保存完整路径才能对其进行后续操作
 print "dir:",obj
 else:
 file_list.append(os.path.join(path, obj))
 print "file:",obj
print "目录列表:",dir_list
print "文件列表:",file_list
#如果项判断是否是文件时用os.isfile()

(注:使用os.isdir()与os.isfile()时,参数必须是一个相对路径或者绝对路径,不能光是一个文件名或者目录名称,这也是上面示例代码中使用os.path.join()的原因,否则函数将判断不出正确结果)

运行示例

python遍历文件目录、批量处理同类文件

批量处理目录下同类文件

以处理pcap文件为例

1、获取某一文件夹下所有pcap包路径,过滤掉其它文件

def getPathFile(path):
 '''
 name:getPathFile
 function:获取所给文件夹下所有pcap文件路径
 path:所给文件夹路径
 '''
 Path = []
 try:
 pathDir = os.listdir(path)
 for allDir in pathDir:
  child = os.path.join('%s/%s' % (path, allDir))
  #跳过文件夹以及非流量包文件,将后缀名改为自己需要的文件类型即可实现自己的过滤
  if os.path.isfile(child) and (".pcap" in str(allDir) or (".cap" in str(allDir))): 
  Path.append(child)
 except:
 pass
 return Path

2、处理函数,打印一个pcap文件中所有数据包的五元组信息{src_ip,src_port,dst_ip,dst_port}

def print_pack_f(file_path):
 '''
 name:print_pack_f
 function:打印一个pcap文件中所有数据包的五元组信息
 file_path:所给pcap文件路径
 '''
 file_p= open(file_path)
 pcap = dpkt.pcap.Reader(file_p) 
 if not pcap:
 return
 print "\n\n*******file:%s*******\n"% file_path
 for (ts,buf) in pcap:
 try:
 eth = dpkt.ethernet.Ethernet(buf) #解包,物理层
 if not isinstance(eth.data, dpkt.ip.IP): #解包,网络层
 continue
 ip = eth.data
 src_ip="%d.%d.%d.%d"%tuple(map(ord,list(ip.src))) 
 dst_ip="%d.%d.%d.%d"%tuple(map(ord,list(ip.dst)))
 if (not isinstance(ip.data, dpkt.tcp.TCP)) and (not isinstance(ip.data, dpkt.udp.UDP)): #解包,传输层
 continue
 transf= ip.data
 print "<",src_ip,":",transf.sport,"-->",dst_ip,":",transf.dport,">"
 except Exception,err:
 print "[error] %s" % err

3、调用示例

def main(dir_path):
 all_file_path=getPathFile(dir_path) #获取目录下所有pcap文件路径
 for file in all_file_path: #遍历处理
 print_pack_f(file) #单个pcap文件处理,可将本函数替换成自定义的功能,便可实现批量处理

if __name__ == '__main__':
 opts,args = getopt.getopt(sys.argv[1:], "hi:") #从命令行获取参数
 if not opts: #若没有带参数
 print "\n\
 *******************\n\
 warn! please enter related parameters,enter -h for help!\n\n\
 *******************\n"
 sys.exit()
 input_path=''
 for op, value in opts:
 if op == "-i":
 input_path = value
 elif op == "-h":
 usage() #帮助信息,只是简单的一个输出函数,输出内容自定义
 sys.exit()
 main(input_path)

结果展示

测试目录如下

python遍历文件目录、批量处理同类文件

运行结果(python test.py -i ./test)

python遍历文件目录、批量处理同类文件

完毕

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python Web框架Flask中使用新浪SAE云存储实例
Feb 08 Python
python制作小说爬虫实录
Aug 14 Python
Tensorflow之Saver的用法详解
Apr 23 Python
Django Admin实现三级联动的示例代码(省市区)
Jun 22 Python
python3.x 将byte转成字符串的方法
Jul 17 Python
idea创建springMVC框架和配置小文件的教程图解
Sep 18 Python
对json字符串与python字符串的不同之处详解
Dec 19 Python
python爬虫之自制英汉字典
Jun 24 Python
Python闭包装饰器使用方法汇总
Jun 29 Python
python递归函数用法详解
Oct 26 Python
matplotlib grid()设置网格线外观的实现
Feb 22 Python
深入理解pytorch库的dockerfile
Jun 10 Python
解决Pycharm 包已经下载,但是运行代码提示找不到模块的问题
Aug 31 #Python
python批量处理文件或文件夹
Jul 28 #Python
在pycharm中显示python画的图方法
Aug 31 #Python
关于django 1.10 CSRF验证失败的解决方法
Aug 31 #Python
详解python中的模块及包导入
Aug 30 #Python
详解Python self 参数
Aug 30 #Python
Python 70行代码实现简单算式计算器解析
Aug 30 #Python
You might like
现磨咖啡骗局!现磨咖啡=新鲜咖啡?现磨咖啡背后的猫腻你不懂!
2019/03/28 冲泡冲煮
微盾PHP脚本加密专家php解密算法
2020/09/13 PHP
php 搜索框提示(自动完成)实例代码
2012/02/05 PHP
微信公众平台开发之天气预报功能
2015/08/31 PHP
Symfony2联合查询实现方法
2016/03/18 PHP
php文件管理基本功能简单操作
2017/01/16 PHP
改善用户体验的五款jQuery插件分享
2011/05/22 Javascript
Knockout text绑定DOM的使用方法
2013/11/15 Javascript
网页右侧悬浮滚动在线qq客服代码示例
2014/04/28 Javascript
Lab.js初次使用笔记
2015/02/28 Javascript
详细分析JavaScript变量类型
2015/07/08 Javascript
跟我学习javascript的this关键字
2020/05/28 Javascript
完美实现bootstrap分页查询
2015/12/09 Javascript
JS基于ocanvas插件实现的简单画板效果代码(附demo源码下载)
2016/04/05 Javascript
js动态生成form 并用ajax方式提交的实现方法
2016/09/09 Javascript
seajs模块之间依赖的加载以及模块的执行
2016/10/21 Javascript
Angular.JS利用ng-disabled属性和ng-model实现禁用button效果
2017/04/05 Javascript
react-native fetch的具体使用方法
2017/11/01 Javascript
JavaScript实现单例模式实例分享
2017/12/22 Javascript
详解vue-router 初始化时做了什么
2018/06/11 Javascript
Angular CLI 使用教程指南参考小结
2019/04/10 Javascript
ES6中定义类和对象的方法示例
2019/07/31 Javascript
Angular之jwt令牌身份验证的实现
2020/02/14 Javascript
[06:11]2014DOTA2国际邀请赛 专访团结一心的VG战队
2014/07/21 DOTA
python3+PyQt5实现文档打印功能
2018/04/24 Python
pytorch使用Variable实现线性回归
2019/05/21 Python
numpy库与pandas库axis=0,axis= 1轴的用法详解
2019/05/27 Python
Python列表list常用内建函数实例小结
2019/10/22 Python
python实现扫雷游戏
2020/03/03 Python
python3爬虫GIL修改多线程实例讲解
2020/11/24 Python
HTML5实现的震撼3D焦点图动画的示例代码
2019/09/26 HTML / CSS
英国时尚运动品牌的合集:The Sports Edit
2017/12/20 全球购物
使用C#编写创建一个线程的代码
2013/01/22 面试题
副厂长岗位职责
2014/02/02 职场文书
有兼职工作经历的简历自我评价
2014/03/07 职场文书
Python Numpy库的超详细教程
2022/04/06 Python