Python判断两个文件是否相同与两个文本进行相同项筛选的方法


Posted in Python onMarch 01, 2019

python判断两个文件是否相同

import hashlib
def getHash(f):
  line=f.readline()
  hash=hashlib.md5()
  while(line):
    hash.update(line)
    line=f.readline()
  return hash.hexdigest()
def IsHashEqual(f1,f2):
  str1=getHash(f1)
  str2=getHash(f2)
  return str1==str2
if __name__ == '__main__':
  f1=open("D:/2.iso","rb")
  f2=open("E:/wenjian/1.iso","rb")
  print IsHashEqual(f1,f2)

计算2个文件的MD5值,大文件计算较慢

python对两个文本进行相同项筛选

import os
import os.path as osp
def filter(path):
  file_path = osp.join(path, 'index.txt')
  if osp.exists(file_path):
    return file_path
  index_file = open(file_path, 'a+')
  if not os.path.isdir(path):  #判断path是否为路径 
    return  
  for root, dirs, list in os.walk(path):
    for i in list: 
      dir = os.path.join(root, i)  #将分离的部分组成一个路径名 
      #if os.path.getsize(dir) < 60000:  #获取文件大小 
        #os.remove(dir)       #删除文件 
      print (i)
      index_file.write(i+'\n')
  index_file.close()    
def compare(path):
  file=osp.join(path, 'label.txt')
  file_path = osp.join(path, 'index.txt')
  with open(file_path, 'r') as file1:
     with open(file, 'r') as file2:
       same = set(file1).intersection(file2)
  same.discard('\n')
  with open('some_output_file.txt', 'w') as file_out:
     for line in same:
       file_out.write(line)
  file_out.close()
filter(r'D:\Desktop\jiaoben\ci')
compare(r'D:\Desktop\jiaoben\ci')

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,谢谢大家对三水点靠木的支持。如果你想了解更多相关内容请查看下面相关链接

Python 相关文章推荐
详解在Python程序中解析并修改XML内容的方法
Nov 16 Python
Python selenium如何设置等待时间
Sep 15 Python
解决python写入mysql中datetime类型遇到的问题
Jun 21 Python
Python使用pyshp库读取shapefile信息的方法
Dec 29 Python
Pycharm 设置默认头的图文教程
Jan 17 Python
Python实现爬取马云的微博功能示例
Feb 16 Python
pyqt实现.ui文件批量转换为对应.py文件脚本
Jun 19 Python
Python使用tkinter模块实现推箱子游戏
Oct 08 Python
python with (as)语句实例详解
Feb 04 Python
Windows下Pycharm远程连接虚拟机中Centos下的Python环境(图文教程详解)
Mar 19 Python
基于Python爬取股票数据过程详解
Oct 21 Python
我对PyTorch dataloader里的shuffle=True的理解
May 20 Python
Python脚本按照当前日期创建多级目录
Mar 01 #Python
Python enumerate函数功能与用法示例
Mar 01 #Python
django模板加载静态文件的方法步骤
Mar 01 #Python
Python3中编码与解码之Unicode与bytes的讲解
Feb 28 #Python
Python multiprocessing多进程原理与应用示例
Feb 28 #Python
Python中的异常处理try/except/finally/raise用法分析
Feb 28 #Python
python使用phoenixdb操作hbase的方法示例
Feb 28 #Python
You might like
用PHP函数解决SQL injection
2006/10/09 PHP
11个PHPer必须要了解的编程规范
2014/09/22 PHP
PHP微信分享开发详解
2017/01/14 PHP
Kindeditor编辑器添加图片上传水印功能(php代码)
2017/08/03 PHP
PHP实现微信支付(jsapi支付)流程步骤详解
2018/03/15 PHP
thinkphp5框架前后端分离项目实现分页功能的方法分析
2019/10/08 PHP
javascript 同时在IE和FireFox获取KeyCode的代码
2010/02/07 Javascript
JS中使用Array函数shift和pop创建可忽略参数的例子
2014/05/28 Javascript
浅谈Javascript如何实现匀速运动
2014/12/19 Javascript
Bootstrap编写一个兼容主流浏览器的受众巨幕式风格页面
2016/07/01 Javascript
javascript输出AscII码扩展集中的字符方法
2016/12/26 Javascript
正则表达式基本语法及表单验证操作详解【基于JS】
2017/04/07 Javascript
angular 实现下拉列表组件的示例代码
2019/03/09 Javascript
Vue入门学习笔记【基本概念、对象、过滤器、指令等】
2019/04/13 Javascript
javascript原型链学习记录之继承实现方式分析
2019/05/01 Javascript
详解微信小程序自定义组件的实现及数据交互
2019/07/22 Javascript
js实现倒计时秒杀效果
2020/03/25 Javascript
Vue 中使用 typescript的方法详解
2020/02/17 Javascript
彻底搞懂并解决vue-cli4中图片显示的问题实现
2020/08/31 Javascript
基于jQuery拖拽事件的封装
2020/11/29 jQuery
详解Python的Django框架中的templates设置
2015/05/11 Python
python中import学习备忘笔记
2017/01/24 Python
python中字符串变二维数组的实例讲解
2018/04/03 Python
对Python 2.7 pandas 中的read_excel详解
2018/05/04 Python
浅谈python3.6的tkinter运行问题
2019/02/22 Python
Python 一键获取百度网盘提取码的方法
2019/08/01 Python
Python 实现将大图切片成小图,将小图组合成大图的例子
2020/03/14 Python
使用keras实现densenet和Xception的模型融合
2020/05/23 Python
Python下使用Trackbar实现绘图板
2020/10/27 Python
以实惠的价格提供高品质的时尚:Newchic
2018/01/18 全球购物
日本最大的购物网站:日本乐天市场(Rakuten Ichiba)
2020/11/04 全球购物
环境科学专业个人求职信
2013/12/15 职场文书
关爱女孩行动实施方案
2014/03/13 职场文书
工人先进事迹材料
2014/12/26 职场文书
2015年护士医德医风自我评价
2015/03/03 职场文书
小数乘法教学反思
2016/02/22 职场文书