Python判断两个文件是否相同与两个文本进行相同项筛选的方法


Posted in Python onMarch 01, 2019

python判断两个文件是否相同

import hashlib
def getHash(f):
  line=f.readline()
  hash=hashlib.md5()
  while(line):
    hash.update(line)
    line=f.readline()
  return hash.hexdigest()
def IsHashEqual(f1,f2):
  str1=getHash(f1)
  str2=getHash(f2)
  return str1==str2
if __name__ == '__main__':
  f1=open("D:/2.iso","rb")
  f2=open("E:/wenjian/1.iso","rb")
  print IsHashEqual(f1,f2)

计算2个文件的MD5值,大文件计算较慢

python对两个文本进行相同项筛选

import os
import os.path as osp
def filter(path):
  file_path = osp.join(path, 'index.txt')
  if osp.exists(file_path):
    return file_path
  index_file = open(file_path, 'a+')
  if not os.path.isdir(path):  #判断path是否为路径 
    return  
  for root, dirs, list in os.walk(path):
    for i in list: 
      dir = os.path.join(root, i)  #将分离的部分组成一个路径名 
      #if os.path.getsize(dir) < 60000:  #获取文件大小 
        #os.remove(dir)       #删除文件 
      print (i)
      index_file.write(i+'\n')
  index_file.close()    
def compare(path):
  file=osp.join(path, 'label.txt')
  file_path = osp.join(path, 'index.txt')
  with open(file_path, 'r') as file1:
     with open(file, 'r') as file2:
       same = set(file1).intersection(file2)
  same.discard('\n')
  with open('some_output_file.txt', 'w') as file_out:
     for line in same:
       file_out.write(line)
  file_out.close()
filter(r'D:\Desktop\jiaoben\ci')
compare(r'D:\Desktop\jiaoben\ci')

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,谢谢大家对三水点靠木的支持。如果你想了解更多相关内容请查看下面相关链接

Python 相关文章推荐
利用python获得时间的实例说明
Mar 25 Python
详解Python爬虫的基本写法
Jan 08 Python
Python进程间通信之共享内存详解
Oct 30 Python
Python搜索引擎实现原理和方法
Nov 27 Python
Python数据分析库pandas基本操作方法
Apr 08 Python
在Pandas中处理NaN值的方法
Jun 25 Python
Python enumerate函数遍历数据对象组合过程解析
Dec 11 Python
python圣诞树编写实例详解
Feb 13 Python
Python爬虫实现vip电影下载的示例代码
Apr 20 Python
如何基于python实现不邻接植花
May 01 Python
Python数据库封装实现代码示例解析
Sep 05 Python
利于python脚本编写可视化nmap和masscan的方法
Dec 29 Python
Python脚本按照当前日期创建多级目录
Mar 01 #Python
Python enumerate函数功能与用法示例
Mar 01 #Python
django模板加载静态文件的方法步骤
Mar 01 #Python
Python3中编码与解码之Unicode与bytes的讲解
Feb 28 #Python
Python multiprocessing多进程原理与应用示例
Feb 28 #Python
Python中的异常处理try/except/finally/raise用法分析
Feb 28 #Python
python使用phoenixdb操作hbase的方法示例
Feb 28 #Python
You might like
PHP学习之数组的定义和填充
2011/04/17 PHP
PHP设计模式之责任链模式的深入解析
2013/06/13 PHP
php解压文件代码实现php在线解压
2014/02/13 PHP
Yii2主题(Theme)用法详解
2016/07/23 PHP
JS中==与===操作符的比较
2009/03/21 Javascript
jquery validate poshytip 自定义样式
2012/11/26 Javascript
禁止选中文字兼容IE、Chrome、FF等
2013/09/04 Javascript
jQuery在页面加载时动态修改图片尺寸的方法
2015/03/20 Javascript
JavaScript中利用jQuery绑定事件的几种方式小结
2016/03/06 Javascript
Javascript的表单与验证-非空验证
2016/03/18 Javascript
js 中获取制定的cook信息实现方法
2016/11/19 Javascript
利用fecha进行JS日期处理
2016/11/21 Javascript
自动适应iframe右边的高度
2016/12/22 Javascript
Html5 js实现手风琴效果
2020/04/17 Javascript
webpack写jquery插件的环境配置
2017/12/21 jQuery
Vue SSR 组件加载问题
2018/05/02 Javascript
2019 年编写现代 JavaScript 代码的5个小技巧(小结)
2019/01/15 Javascript
浅谈redux, koa, express 中间件实现对比解析
2019/05/23 Javascript
vue多页面项目中路由使用history模式的方法
2019/09/23 Javascript
javascript实现倒计时关闭广告
2021/02/09 Javascript
在Python的web框架中中编写日志列表的教程
2015/04/30 Python
python利用Guetzli批量压缩图片
2017/03/23 Python
老生常谈Python序列化和反序列化
2017/06/28 Python
更新修改后的Python模块方法
2019/03/03 Python
Linux下通过python获取本机ip方法示例
2019/09/06 Python
python框架flask入门之环境搭建及开启调试
2020/06/07 Python
解决python中0x80072ee2错误的方法
2020/07/19 Python
CSS3+Sprite实现僵尸行走动画特效源码
2016/01/27 HTML / CSS
卡骆驰德国官方网站:Crocs德国
2019/03/29 全球购物
建筑工程专业学生的自我评价
2013/12/25 职场文书
工业自动化毕业生自荐信范文
2014/01/04 职场文书
教师自我鉴定范文
2014/03/20 职场文书
酒店圣诞节活动总结
2015/05/06 职场文书
三国演义读书笔记
2015/06/25 职场文书
《假如》教学反思
2016/02/17 职场文书
Python Pytorch查询图像的特征从集合或数据库中查找图像
2022/04/09 Python