Python判断两个文件是否相同与两个文本进行相同项筛选的方法


Posted in Python onMarch 01, 2019

python判断两个文件是否相同

import hashlib
def getHash(f):
  line=f.readline()
  hash=hashlib.md5()
  while(line):
    hash.update(line)
    line=f.readline()
  return hash.hexdigest()
def IsHashEqual(f1,f2):
  str1=getHash(f1)
  str2=getHash(f2)
  return str1==str2
if __name__ == '__main__':
  f1=open("D:/2.iso","rb")
  f2=open("E:/wenjian/1.iso","rb")
  print IsHashEqual(f1,f2)

计算2个文件的MD5值,大文件计算较慢

python对两个文本进行相同项筛选

import os
import os.path as osp
def filter(path):
  file_path = osp.join(path, 'index.txt')
  if osp.exists(file_path):
    return file_path
  index_file = open(file_path, 'a+')
  if not os.path.isdir(path):  #判断path是否为路径 
    return  
  for root, dirs, list in os.walk(path):
    for i in list: 
      dir = os.path.join(root, i)  #将分离的部分组成一个路径名 
      #if os.path.getsize(dir) < 60000:  #获取文件大小 
        #os.remove(dir)       #删除文件 
      print (i)
      index_file.write(i+'\n')
  index_file.close()    
def compare(path):
  file=osp.join(path, 'label.txt')
  file_path = osp.join(path, 'index.txt')
  with open(file_path, 'r') as file1:
     with open(file, 'r') as file2:
       same = set(file1).intersection(file2)
  same.discard('\n')
  with open('some_output_file.txt', 'w') as file_out:
     for line in same:
       file_out.write(line)
  file_out.close()
filter(r'D:\Desktop\jiaoben\ci')
compare(r'D:\Desktop\jiaoben\ci')

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,谢谢大家对三水点靠木的支持。如果你想了解更多相关内容请查看下面相关链接

Python 相关文章推荐
Python中使用PIPE操作Linux管道
Feb 04 Python
Python与R语言的简要对比
Nov 14 Python
Python中常用信号signal类型实例
Jan 25 Python
python实现RabbitMQ的消息队列的示例代码
Nov 08 Python
django项目用higcharts统计最近七天文章点击量
Aug 17 Python
python3实现绘制二维点图
Dec 04 Python
python多维数组分位数的求取方式
Mar 03 Python
python 子类调用父类的构造函数实例
Mar 12 Python
pip install 使用国内镜像的方法示例
Apr 03 Python
OpenCV Python实现图像指定区域裁剪
Mar 12 Python
Python自动化测试基础必备知识点总结
Feb 07 Python
详解Python如何批量采集京东商品数据流程
Jan 22 Python
Python脚本按照当前日期创建多级目录
Mar 01 #Python
Python enumerate函数功能与用法示例
Mar 01 #Python
django模板加载静态文件的方法步骤
Mar 01 #Python
Python3中编码与解码之Unicode与bytes的讲解
Feb 28 #Python
Python multiprocessing多进程原理与应用示例
Feb 28 #Python
Python中的异常处理try/except/finally/raise用法分析
Feb 28 #Python
python使用phoenixdb操作hbase的方法示例
Feb 28 #Python
You might like
PHP的PSR规范中文版
2013/09/28 PHP
ThinkPHP连接数据库及主从数据库的设置教程
2014/08/22 PHP
PHP版微信公众平台红包API
2015/04/02 PHP
PHP实现根据数组某个键值大小进行排序的方法
2018/03/13 PHP
js本身的局限性 别让javascript做太多事
2010/03/23 Javascript
基于jquery的仿百度的鼠标移入图片抖动效果
2010/09/17 Javascript
jQuery mobile 移动web(4)
2015/12/20 Javascript
Bootstrap 轮播(Carousel)插件
2016/12/26 Javascript
javascript十六进制数字和ASCII字符之间的转换方法
2016/12/27 Javascript
vue.js开发环境搭建教程
2017/05/04 Javascript
JavaScript数组_动力节点Java学院整理
2017/06/26 Javascript
mint-ui在vue中的使用示例
2018/04/05 Javascript
webpack打包多页面的方法
2018/11/30 Javascript
js中数组常用方法总结(推荐)
2019/04/09 Javascript
[08:54]《一刀刀一天》之DOTA全时刻18:十九支奔赴西雅图队伍全部出炉
2014/06/04 DOTA
[01:01:52]DOTA2-DPC中国联赛定级赛 SAG vs iG BO3第二场 1月9日
2021/03/11 DOTA
Python实现文件复制删除
2016/04/19 Python
PyQt5每天必学之关闭窗口
2018/04/19 Python
Python面向对象思想与应用入门教程【类与对象】
2019/04/12 Python
python如何实现异步调用函数执行
2019/07/08 Python
Python装饰器使用你可能不知道的几种姿势
2019/10/25 Python
pytorch实现MNIST手写体识别
2020/02/14 Python
详解pyinstaller生成exe的闪退问题解决方案
2020/06/19 Python
The North Face官方旗舰店:美国著名户外品牌
2020/09/28 全球购物
关于Assembly命名空间的三个面试题
2015/07/23 面试题
北京鼎普科技股份有限公司软件测试面试题
2012/04/07 面试题
家长会学生家长演讲稿
2013/12/29 职场文书
骨干教师考核方案
2014/05/09 职场文书
企业环保标语
2014/06/10 职场文书
庆国庆国旗下讲话稿2014
2014/09/21 职场文书
2014统计局民主生活会对照检查材料思想汇报
2014/10/02 职场文书
2014年应急工作总结
2014/12/11 职场文书
先进基层党组织事迹材料
2014/12/25 职场文书
爱国主题班会教案
2015/08/14 职场文书
2016秋季幼儿园开学寄语
2015/12/03 职场文书
Java 多线程并发FutureTask
2022/06/28 Java/Android