Python判断两个文件是否相同与两个文本进行相同项筛选的方法


Posted in Python onMarch 01, 2019

python判断两个文件是否相同

import hashlib
def getHash(f):
  line=f.readline()
  hash=hashlib.md5()
  while(line):
    hash.update(line)
    line=f.readline()
  return hash.hexdigest()
def IsHashEqual(f1,f2):
  str1=getHash(f1)
  str2=getHash(f2)
  return str1==str2
if __name__ == '__main__':
  f1=open("D:/2.iso","rb")
  f2=open("E:/wenjian/1.iso","rb")
  print IsHashEqual(f1,f2)

计算2个文件的MD5值,大文件计算较慢

python对两个文本进行相同项筛选

import os
import os.path as osp
def filter(path):
  file_path = osp.join(path, 'index.txt')
  if osp.exists(file_path):
    return file_path
  index_file = open(file_path, 'a+')
  if not os.path.isdir(path):  #判断path是否为路径 
    return  
  for root, dirs, list in os.walk(path):
    for i in list: 
      dir = os.path.join(root, i)  #将分离的部分组成一个路径名 
      #if os.path.getsize(dir) < 60000:  #获取文件大小 
        #os.remove(dir)       #删除文件 
      print (i)
      index_file.write(i+'\n')
  index_file.close()    
def compare(path):
  file=osp.join(path, 'label.txt')
  file_path = osp.join(path, 'index.txt')
  with open(file_path, 'r') as file1:
     with open(file, 'r') as file2:
       same = set(file1).intersection(file2)
  same.discard('\n')
  with open('some_output_file.txt', 'w') as file_out:
     for line in same:
       file_out.write(line)
  file_out.close()
filter(r'D:\Desktop\jiaoben\ci')
compare(r'D:\Desktop\jiaoben\ci')

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,谢谢大家对三水点靠木的支持。如果你想了解更多相关内容请查看下面相关链接

Python 相关文章推荐
使用Python实现BT种子和磁力链接的相互转换
Nov 09 Python
Python 通过pip安装Django详细介绍
Apr 28 Python
Python遍历某目录下的所有文件夹与文件路径
Mar 15 Python
python设置值及NaN值处理方法
Jul 03 Python
Python多继承原理与用法示例
Aug 23 Python
selenium设置proxy、headers的方法(phantomjs、Chrome、Firefox)
Nov 29 Python
python爬取cnvd漏洞库信息的实例
Feb 14 Python
简单了解python 邮件模块的使用方法
Jul 24 Python
python groupby 函数 as_index详解
Dec 16 Python
python获取linux系统信息的三种方法
Oct 14 Python
Python爬虫基础讲解之请求
May 13 Python
基于Python绘制子图及子图刻度的变换等的问题
May 23 Python
Python脚本按照当前日期创建多级目录
Mar 01 #Python
Python enumerate函数功能与用法示例
Mar 01 #Python
django模板加载静态文件的方法步骤
Mar 01 #Python
Python3中编码与解码之Unicode与bytes的讲解
Feb 28 #Python
Python multiprocessing多进程原理与应用示例
Feb 28 #Python
Python中的异常处理try/except/finally/raise用法分析
Feb 28 #Python
python使用phoenixdb操作hbase的方法示例
Feb 28 #Python
You might like
在Windows中安装Apache2和PHP4的权威指南
2006/10/09 PHP
PHP制作图型计数器的例子
2006/10/09 PHP
php中实现精确设置session过期时间的方法
2014/07/17 PHP
php常用字符串查找函数strstr()与strpos()实例分析
2019/06/21 PHP
浅谈tudou土豆网首页图片延迟加载的效果
2010/06/23 Javascript
IE6图片加载的一个BUG解决方法
2010/07/13 Javascript
使用jQuery的将桌面应用程序引入浏览器
2010/11/19 Javascript
IE下写xml文件的两种方式(fso/saveAs)
2013/08/05 Javascript
Javascript中实现String.startsWith和endsWith方法
2015/06/10 Javascript
jQuery手动点击实现图片轮播特效
2020/04/20 Javascript
javascript日期验证之输入日期大于等于当前日期
2015/12/13 Javascript
通过隐藏iframe实现无刷新上传文件操作
2016/03/16 Javascript
jQuery的图片轮播插件PgwSlideshow使用详解
2016/08/11 Javascript
Vue.js表单控件实践
2016/10/27 Javascript
jQuery实现分页功能(含ajax请求、后台数据、附完整demo)
2017/04/03 jQuery
javascript回调函数的概念理解与用法分析
2017/05/27 Javascript
JavaScript生成图形验证码
2020/08/24 Javascript
vue+element实现表格新增、编辑、删除功能
2019/05/28 Javascript
如何利用node转发请求详解
2020/09/17 Javascript
使用Python的Treq on Twisted来进行HTTP压力测试
2015/04/16 Python
Python小进度条显示代码
2019/03/05 Python
Python图像处理模块ndimage用法实例分析
2019/09/05 Python
Python3离线安装Requests模块问题
2019/10/13 Python
python爬虫使用scrapy注意事项
2020/11/23 Python
HTML5 和小程序实现拍照图片旋转、压缩和上传功能
2018/10/08 HTML / CSS
英国团购网站:Groupon英国
2017/11/28 全球购物
亚洲颇具影响力的男性在线购物零售商:His
2019/11/24 全球购物
俄罗斯宠物用品网上商店:ZooMag
2019/12/12 全球购物
什么是托管函数?托管函数有什么用?
2014/06/15 面试题
安全生产检查通报
2014/01/29 职场文书
银行服务明星推荐材料
2014/05/29 职场文书
项目投资合作意向书
2014/07/29 职场文书
团拜会主持词
2015/07/04 职场文书
导游词之丽江普济寺
2019/10/22 职场文书
你真的了解redis为什么要提供pipeline功能
2021/06/22 Redis
CKAD认证中部署k8s并配置Calico插件
2022/03/31 Servers