Python判断两个文件是否相同与两个文本进行相同项筛选的方法


Posted in Python onMarch 01, 2019

python判断两个文件是否相同

import hashlib
def getHash(f):
  line=f.readline()
  hash=hashlib.md5()
  while(line):
    hash.update(line)
    line=f.readline()
  return hash.hexdigest()
def IsHashEqual(f1,f2):
  str1=getHash(f1)
  str2=getHash(f2)
  return str1==str2
if __name__ == '__main__':
  f1=open("D:/2.iso","rb")
  f2=open("E:/wenjian/1.iso","rb")
  print IsHashEqual(f1,f2)

计算2个文件的MD5值,大文件计算较慢

python对两个文本进行相同项筛选

import os
import os.path as osp
def filter(path):
  file_path = osp.join(path, 'index.txt')
  if osp.exists(file_path):
    return file_path
  index_file = open(file_path, 'a+')
  if not os.path.isdir(path):  #判断path是否为路径 
    return  
  for root, dirs, list in os.walk(path):
    for i in list: 
      dir = os.path.join(root, i)  #将分离的部分组成一个路径名 
      #if os.path.getsize(dir) < 60000:  #获取文件大小 
        #os.remove(dir)       #删除文件 
      print (i)
      index_file.write(i+'\n')
  index_file.close()    
def compare(path):
  file=osp.join(path, 'label.txt')
  file_path = osp.join(path, 'index.txt')
  with open(file_path, 'r') as file1:
     with open(file, 'r') as file2:
       same = set(file1).intersection(file2)
  same.discard('\n')
  with open('some_output_file.txt', 'w') as file_out:
     for line in same:
       file_out.write(line)
  file_out.close()
filter(r'D:\Desktop\jiaoben\ci')
compare(r'D:\Desktop\jiaoben\ci')

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,谢谢大家对三水点靠木的支持。如果你想了解更多相关内容请查看下面相关链接

Python 相关文章推荐
python不换行之end=与逗号的意思及用途
Nov 21 Python
Python常用字符串替换函数strip、replace及sub用法示例
May 21 Python
python实现诗歌游戏(类继承)
Feb 26 Python
python pygame实现挡板弹球游戏
Nov 25 Python
Python高阶函数、常用内置函数用法实例分析
Dec 26 Python
基于Python和PyYAML读取yaml配置文件数据
Jan 13 Python
Python +Selenium解决图片验证码登录或注册问题(推荐)
Feb 09 Python
matlab灰度图像调整及imadjust函数的用法详解
Feb 27 Python
python str字符串转uuid实例
Mar 03 Python
python filecmp.dircmp实现递归比对两个目录的方法
May 22 Python
Python StringIO及BytesIO包使用方法解析
Jun 15 Python
python中字符串String及其常见操作指南(方法、函数)
Apr 06 Python
Python脚本按照当前日期创建多级目录
Mar 01 #Python
Python enumerate函数功能与用法示例
Mar 01 #Python
django模板加载静态文件的方法步骤
Mar 01 #Python
Python3中编码与解码之Unicode与bytes的讲解
Feb 28 #Python
Python multiprocessing多进程原理与应用示例
Feb 28 #Python
Python中的异常处理try/except/finally/raise用法分析
Feb 28 #Python
python使用phoenixdb操作hbase的方法示例
Feb 28 #Python
You might like
一棵php的类树(支持无限分类)
2006/10/09 PHP
PHP实现MySQL更新记录的代码
2008/06/07 PHP
php读取csv数据保存到数组的方法
2015/01/03 PHP
PHP利用APC模块实现文件上传进度条的方法
2015/01/26 PHP
PHP中使用curl入门教程
2015/07/02 PHP
PHP实现求两个字符串最长公共子串的方法示例
2017/11/17 PHP
理解JavaScript的caller,callee,call,apply
2009/04/28 Javascript
js实现GridView单选效果自动设置交替行、选中行、鼠标移动行背景色
2010/05/27 Javascript
JavaScript 放大镜 移动镜片效果代码
2011/05/09 Javascript
JavaScript 的继承
2011/10/01 Javascript
jQuery仿Excel表格编辑功能的实现代码
2013/05/01 Javascript
js实现的类似于asp数据字典的数据类型代码实例
2014/09/03 Javascript
详细分析JavaScript变量类型
2015/07/08 Javascript
javascript实现base64 md5 sha1 密码加密
2015/09/09 Javascript
jquery可定制的在线UEditor编辑器
2015/11/17 Javascript
值得分享的轻量级Bootstrap Table表格插件
2016/05/30 Javascript
通过javascript进行UTF-8编码的实现方法
2016/06/27 Javascript
HTML中setCapture、releaseCapture 使用方法浅析
2016/09/25 Javascript
js实现拖拽功能
2017/03/01 Javascript
vue translate peoject实现在线翻译功能【新手必看】
2018/06/07 Javascript
解决vue 界面在苹果手机上滑动点击事件等卡顿问题
2018/11/27 Javascript
vue h5移动端禁止缩放代码
2019/10/28 Javascript
JavaScript 引用类型实例详解【数组、对象、严格模式等】
2020/05/13 Javascript
解决Vue项目中tff报错的问题
2020/10/21 Javascript
[01:26]DOTA2荣耀之路2:iG,China
2018/05/24 DOTA
[57:12]完美世界DOTA2联赛循环赛 Inki vs Matador BO2第一场 10.31
2020/11/02 DOTA
python 图片去噪的方法示例
2019/07/09 Python
Django-Model数据库操作(增删改查、连表结构)详解
2019/07/17 Python
使用python 计算百分位数实现数据分箱代码
2020/03/03 Python
Python字符串格式化f-string多种功能实现
2020/05/07 Python
手把手教你用纯css3实现轮播图效果实例
2017/05/04 HTML / CSS
澳大利亚儿童精品仓库:Goo & Co.
2019/06/20 全球购物
应用外语系自荐信
2014/06/26 职场文书
批评与自我批评范文
2014/10/15 职场文书
十二月早安励志心语大全
2019/12/03 职场文书
解决ObjectMapper.convertValue() 遇到的一些问题
2021/06/30 Java/Android