Python判断两个文件是否相同与两个文本进行相同项筛选的方法


Posted in Python onMarch 01, 2019

python判断两个文件是否相同

import hashlib
def getHash(f):
  line=f.readline()
  hash=hashlib.md5()
  while(line):
    hash.update(line)
    line=f.readline()
  return hash.hexdigest()
def IsHashEqual(f1,f2):
  str1=getHash(f1)
  str2=getHash(f2)
  return str1==str2
if __name__ == '__main__':
  f1=open("D:/2.iso","rb")
  f2=open("E:/wenjian/1.iso","rb")
  print IsHashEqual(f1,f2)

计算2个文件的MD5值,大文件计算较慢

python对两个文本进行相同项筛选

import os
import os.path as osp
def filter(path):
  file_path = osp.join(path, 'index.txt')
  if osp.exists(file_path):
    return file_path
  index_file = open(file_path, 'a+')
  if not os.path.isdir(path):  #判断path是否为路径 
    return  
  for root, dirs, list in os.walk(path):
    for i in list: 
      dir = os.path.join(root, i)  #将分离的部分组成一个路径名 
      #if os.path.getsize(dir) < 60000:  #获取文件大小 
        #os.remove(dir)       #删除文件 
      print (i)
      index_file.write(i+'\n')
  index_file.close()    
def compare(path):
  file=osp.join(path, 'label.txt')
  file_path = osp.join(path, 'index.txt')
  with open(file_path, 'r') as file1:
     with open(file, 'r') as file2:
       same = set(file1).intersection(file2)
  same.discard('\n')
  with open('some_output_file.txt', 'w') as file_out:
     for line in same:
       file_out.write(line)
  file_out.close()
filter(r'D:\Desktop\jiaoben\ci')
compare(r'D:\Desktop\jiaoben\ci')

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,谢谢大家对三水点靠木的支持。如果你想了解更多相关内容请查看下面相关链接

Python 相关文章推荐
python删除文件示例分享
Jan 28 Python
python常用web框架简单性能测试结果分享(包含django、flask、bottle、tornado)
Aug 25 Python
Python制作数据导入导出工具
Jul 31 Python
Python 序列的方法总结
Oct 18 Python
python,Django实现的淘宝客登录功能示例
Jun 12 Python
解决在pycharm运行代码,调用CMD窗口的命令运行显示乱码问题
Aug 23 Python
Python文字截图识别OCR工具实例解析
Mar 05 Python
Selenium webdriver添加cookie实现过程详解
Aug 12 Python
python脚本第一行如何写
Aug 30 Python
如何基于matlab相机标定导出xml文件
Nov 02 Python
python+opencv3.4.0 实现HOG+SVM行人检测的示例代码
Jan 28 Python
Python中Numpy和Matplotlib的基本使用指南
Nov 02 Python
Python脚本按照当前日期创建多级目录
Mar 01 #Python
Python enumerate函数功能与用法示例
Mar 01 #Python
django模板加载静态文件的方法步骤
Mar 01 #Python
Python3中编码与解码之Unicode与bytes的讲解
Feb 28 #Python
Python multiprocessing多进程原理与应用示例
Feb 28 #Python
Python中的异常处理try/except/finally/raise用法分析
Feb 28 #Python
python使用phoenixdb操作hbase的方法示例
Feb 28 #Python
You might like
PHP合并discuz用户脚本的方法
2015/08/04 PHP
Laravel配置全局公共函数的方法步骤
2019/05/09 PHP
php的命名空间与自动加载实现方法
2019/08/25 PHP
JavaScript 学习点滴记录
2009/04/24 Javascript
Javascript 调试利器 Firebug使用详解六
2009/07/05 Javascript
jquery事件机制扩展插件 jquery鼠标右键事件
2011/12/21 Javascript
JavaScript作用域与作用域链深入解析
2013/12/06 Javascript
js将控件隐藏及display属性的使用介绍
2013/12/30 Javascript
js实现文字闪烁特效的方法
2015/12/17 Javascript
AngularJS在IE下取数据总是缓存问题的解决方法
2016/08/05 Javascript
jquery validation验证表单插件
2017/01/07 Javascript
vue双向绑定简要分析
2017/03/23 Javascript
js截取字符串功能的实现方法
2017/09/27 Javascript
浅析vue.js数组的变异方法
2018/06/30 Javascript
在微信小程序中渲染HTML内容的方法示例
2018/09/28 Javascript
从vue源码看props的用法
2019/01/09 Javascript
bootstrapValidator表单校验、更改状态、新增、移除校验字段的实例代码
2020/05/19 Javascript
[01:54]TI珍贵瞬间系列(五):压力
2020/08/29 DOTA
Python中的anydbm模版和shelve模版使用指南
2015/07/09 Python
Python 性能优化技巧总结
2016/11/01 Python
Python数据拟合与广义线性回归算法学习
2017/12/22 Python
Python实现字符串的逆序 C++字符串逆序算法
2020/05/28 Python
Python使用Matlab命令过程解析
2020/06/04 Python
举例详解HTML5中使用JSON格式提交表单
2015/06/16 HTML / CSS
收银员的岗位职责范本
2014/02/04 职场文书
预备党员表决心书
2014/03/11 职场文书
教育专业毕业生推荐信
2014/07/10 职场文书
学生会竞选演讲稿怎么写
2014/08/26 职场文书
2014幼儿园小班工作总结
2014/11/10 职场文书
雷锋观后感
2015/06/10 职场文书
2016高一新生军训心得体会
2016/01/11 职场文书
七年级生物教学反思
2016/02/20 职场文书
vue完美实现el-table列宽自适应
2021/05/08 Vue.js
详解MySQL中的pid与socket
2021/06/15 MySQL
nginx中封禁ip和允许内网ip访问的实现示例
2022/03/17 Servers
Python+Selenium实现抖音、快手、B站、小红书、微视、百度好看视频、西瓜视频、微信视频号、搜狐视频、一点号、大风号、趣头条等短视频自动发布
2022/04/13 Python