Python判断两个文件是否相同与两个文本进行相同项筛选的方法


Posted in Python onMarch 01, 2019

python判断两个文件是否相同

import hashlib
def getHash(f):
  line=f.readline()
  hash=hashlib.md5()
  while(line):
    hash.update(line)
    line=f.readline()
  return hash.hexdigest()
def IsHashEqual(f1,f2):
  str1=getHash(f1)
  str2=getHash(f2)
  return str1==str2
if __name__ == '__main__':
  f1=open("D:/2.iso","rb")
  f2=open("E:/wenjian/1.iso","rb")
  print IsHashEqual(f1,f2)

计算2个文件的MD5值,大文件计算较慢

python对两个文本进行相同项筛选

import os
import os.path as osp
def filter(path):
  file_path = osp.join(path, 'index.txt')
  if osp.exists(file_path):
    return file_path
  index_file = open(file_path, 'a+')
  if not os.path.isdir(path):  #判断path是否为路径 
    return  
  for root, dirs, list in os.walk(path):
    for i in list: 
      dir = os.path.join(root, i)  #将分离的部分组成一个路径名 
      #if os.path.getsize(dir) < 60000:  #获取文件大小 
        #os.remove(dir)       #删除文件 
      print (i)
      index_file.write(i+'\n')
  index_file.close()    
def compare(path):
  file=osp.join(path, 'label.txt')
  file_path = osp.join(path, 'index.txt')
  with open(file_path, 'r') as file1:
     with open(file, 'r') as file2:
       same = set(file1).intersection(file2)
  same.discard('\n')
  with open('some_output_file.txt', 'w') as file_out:
     for line in same:
       file_out.write(line)
  file_out.close()
filter(r'D:\Desktop\jiaoben\ci')
compare(r'D:\Desktop\jiaoben\ci')

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,谢谢大家对三水点靠木的支持。如果你想了解更多相关内容请查看下面相关链接

Python 相关文章推荐
在Python中操作字符串之startswith()方法的使用
May 20 Python
Scrapy的简单使用教程
Oct 24 Python
python实现BackPropagation算法
Dec 14 Python
Python3 实现随机生成一组不重复数并按行写入文件
Apr 09 Python
python-itchat 统计微信群、好友数量,及原始消息数据的实例
Feb 21 Python
详解Python装饰器
Mar 25 Python
用scikit-learn和pandas学习线性回归的方法
Jun 21 Python
详解python 中in 的 用法
Dec 12 Python
python绘制动态曲线教程
Feb 24 Python
python 基于selenium实现鼠标拖拽功能
Dec 24 Python
python sleep和wait对比总结
Feb 03 Python
Python自动操作神器PyAutoGUI的使用教程
Jun 16 Python
Python脚本按照当前日期创建多级目录
Mar 01 #Python
Python enumerate函数功能与用法示例
Mar 01 #Python
django模板加载静态文件的方法步骤
Mar 01 #Python
Python3中编码与解码之Unicode与bytes的讲解
Feb 28 #Python
Python multiprocessing多进程原理与应用示例
Feb 28 #Python
Python中的异常处理try/except/finally/raise用法分析
Feb 28 #Python
python使用phoenixdb操作hbase的方法示例
Feb 28 #Python
You might like
espresso double下 咖啡粉超细时 饼压力对咖啡的影响
2021/03/03 冲泡冲煮
PHP扩展CURL的用法详解
2014/06/20 PHP
CodeIgniter采用config控制的多语言实现根据浏览器语言自动转换功能
2014/07/18 PHP
PHP中strcmp()和strcasecmp()函数字符串比较用法分析
2016/01/07 PHP
Laravel 实现Eloquent模型分组查询并返回每个分组的数量 groupBy()
2019/10/23 PHP
找到一点可怜的关于dojo资料,谢谢作者!
2006/12/06 Javascript
form中限制文本字节数js代码
2007/06/10 Javascript
JS控制显示隐藏兼容问题(IE6、IE7、IE8)
2010/04/01 Javascript
JS 控制小数位数的实现代码
2011/08/02 Javascript
js实现的类似于asp数据字典的数据类型代码实例
2014/09/03 Javascript
js控制网页背景音乐播放与停止的方法
2015/02/06 Javascript
基于LayUI分页和LayUI laypage分页的使用示例
2017/08/02 Javascript
Spring boot 和Vue开发中CORS跨域问题解决
2018/09/05 Javascript
jQuery pager.js 插件动态分页功能实例分析
2019/08/02 jQuery
layui table去掉右侧滑动条的实现方法
2019/09/05 Javascript
JavaScript实现旋转木马轮播图
2020/03/16 Javascript
Javascript 模拟mvc实现点餐程序案例详解
2020/12/24 Javascript
Python中for循环和while循环的基本使用方法
2015/08/21 Python
5个很好的Python面试题问题答案及分析
2018/01/19 Python
python numpy格式化打印的实例
2018/05/14 Python
django中瀑布流写法实例代码
2019/10/14 Python
MoviePy常用剪辑类及Python视频剪辑自动化
2020/12/18 Python
Python爬取酷狗MP3音频的步骤
2021/02/26 Python
HTML5混合开发二维码扫描以及调用本地摄像头
2017/12/27 HTML / CSS
html5利用canvas绘画二级树形结构图的示例
2017/09/27 HTML / CSS
速比涛英国官网:Speedo英国
2019/07/15 全球购物
Watch Station官方网站:世界一流的手表和智能手表
2020/01/05 全球购物
迪卡侬(Decathlon)加拿大官网:源自法国的运动专业超市
2020/11/22 全球购物
电子信息毕业生自荐信
2013/11/16 职场文书
超市业务员岗位职责
2013/12/05 职场文书
办理信用卡收入证明范例
2014/09/13 职场文书
教师个人查摆剖析材料
2014/10/14 职场文书
民间借贷借条范本
2015/05/25 职场文书
导游词之韩国济州岛
2019/10/28 职场文书
python 实现两个变量值进行交换的n种操作
2021/06/02 Python
vue中利用mqtt服务端实现即时通讯的步骤记录
2021/07/01 Vue.js