Python判断两个文件是否相同与两个文本进行相同项筛选的方法


Posted in Python onMarch 01, 2019

python判断两个文件是否相同

import hashlib
def getHash(f):
  line=f.readline()
  hash=hashlib.md5()
  while(line):
    hash.update(line)
    line=f.readline()
  return hash.hexdigest()
def IsHashEqual(f1,f2):
  str1=getHash(f1)
  str2=getHash(f2)
  return str1==str2
if __name__ == '__main__':
  f1=open("D:/2.iso","rb")
  f2=open("E:/wenjian/1.iso","rb")
  print IsHashEqual(f1,f2)

计算2个文件的MD5值,大文件计算较慢

python对两个文本进行相同项筛选

import os
import os.path as osp
def filter(path):
  file_path = osp.join(path, 'index.txt')
  if osp.exists(file_path):
    return file_path
  index_file = open(file_path, 'a+')
  if not os.path.isdir(path):  #判断path是否为路径 
    return  
  for root, dirs, list in os.walk(path):
    for i in list: 
      dir = os.path.join(root, i)  #将分离的部分组成一个路径名 
      #if os.path.getsize(dir) < 60000:  #获取文件大小 
        #os.remove(dir)       #删除文件 
      print (i)
      index_file.write(i+'\n')
  index_file.close()    
def compare(path):
  file=osp.join(path, 'label.txt')
  file_path = osp.join(path, 'index.txt')
  with open(file_path, 'r') as file1:
     with open(file, 'r') as file2:
       same = set(file1).intersection(file2)
  same.discard('\n')
  with open('some_output_file.txt', 'w') as file_out:
     for line in same:
       file_out.write(line)
  file_out.close()
filter(r'D:\Desktop\jiaoben\ci')
compare(r'D:\Desktop\jiaoben\ci')

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,谢谢大家对三水点靠木的支持。如果你想了解更多相关内容请查看下面相关链接

Python 相关文章推荐
python将html转成PDF的实现代码(包含中文)
Mar 04 Python
详解Python中dict与set的使用
Aug 10 Python
Python字符串特性及常用字符串方法的简单笔记
Jan 04 Python
PyCharm设置SSH远程调试的方法
Jul 17 Python
python 列表递归求和、计数、求最大元素的实例
Nov 28 Python
Python中单线程、多线程和多进程的效率对比实验实例
May 14 Python
Django上线部署之IIS的配置方法
Aug 22 Python
Python基于类路径字符串获取静态属性
Mar 12 Python
python学习将数据写入文件并保存方法
Jun 07 Python
python实现图像外边界跟踪操作
Jul 13 Python
python可视化分析的实现(matplotlib、seaborn、ggplot2)
Feb 03 Python
python实现监听键盘
Apr 26 Python
Python脚本按照当前日期创建多级目录
Mar 01 #Python
Python enumerate函数功能与用法示例
Mar 01 #Python
django模板加载静态文件的方法步骤
Mar 01 #Python
Python3中编码与解码之Unicode与bytes的讲解
Feb 28 #Python
Python multiprocessing多进程原理与应用示例
Feb 28 #Python
Python中的异常处理try/except/finally/raise用法分析
Feb 28 #Python
python使用phoenixdb操作hbase的方法示例
Feb 28 #Python
You might like
用Flash图形化数据(一)
2006/10/09 PHP
修改yii2.0用户登录使用的user表为其它的表实现方法(推荐)
2017/08/01 PHP
php关联数组与索引数组及其显示方法
2018/03/12 PHP
静态的动态续篇之来点XML
2006/08/15 Javascript
JS解密入门之凭直觉解
2008/06/25 Javascript
javascript 日历提醒系统( 兼容所有浏览器 )
2009/04/07 Javascript
jquery ajax提交表单数据的两种方式
2009/11/24 Javascript
js和jquery使按钮失效为不可用状态的方法
2014/01/26 Javascript
基于Bootstrap使用jQuery实现简单可编辑表格
2016/05/04 Javascript
JavaScript——DOM操作——Window.document对象详解
2016/07/14 Javascript
JavaScript生成验证码并实现验证功能
2016/09/24 Javascript
jquery  实现轮播图详解及实例代码
2016/10/12 Javascript
jquery实现表单获取短信验证码代码
2017/03/13 Javascript
深入理解JavaScript 参数按值传递
2017/05/24 Javascript
angular使用bootstrap方法手动启动的实例代码
2017/07/18 Javascript
WdatePicker.js时间日期插件的使用方法
2017/07/26 Javascript
基于BootStrap的文本编辑器组件Summernote
2017/10/27 Javascript
vue+canvas实现炫酷时钟效果的倒计时插件(已发布到npm的vue2插件,开箱即用)
2018/11/05 Javascript
vue+高德地图写地图选址组件的方法
2019/05/18 Javascript
JS实现在线ps功能详解
2019/07/31 Javascript
微信小程序的授权实现过程解析
2019/08/02 Javascript
p5.js实现动态图形临摹
2019/10/23 Javascript
python连接MySQL数据库实例分析
2015/05/12 Python
Python利用splinter实现浏览器自动化操作方法
2018/05/11 Python
Python数据类型之List列表实例详解
2019/05/08 Python
Python2.7版os.path.isdir中文路径返回false的解决方法
2019/06/21 Python
numpy ndarray 取出满足特定条件的某些行实例
2019/12/05 Python
html5 input元素新特性_动力节点Java学院整理
2017/07/06 HTML / CSS
世界上最悠久的自行车制造商:Ribble Cycles
2017/03/18 全球购物
应届生新闻编辑求职信
2013/11/19 职场文书
农场厂长岗位职责
2013/12/28 职场文书
远程研修随笔感言
2014/02/10 职场文书
初中班主任评语大全
2014/04/24 职场文书
论文答谢词
2015/01/20 职场文书
python基于scrapy爬取京东笔记本电脑数据并进行简单处理和分析
2021/04/14 Python
《吸血鬼幸存者》新内容发布 追加多个全新模式
2022/04/07 其他游戏