Python判断两个文件是否相同与两个文本进行相同项筛选的方法


Posted in Python onMarch 01, 2019

python判断两个文件是否相同

import hashlib
def getHash(f):
  line=f.readline()
  hash=hashlib.md5()
  while(line):
    hash.update(line)
    line=f.readline()
  return hash.hexdigest()
def IsHashEqual(f1,f2):
  str1=getHash(f1)
  str2=getHash(f2)
  return str1==str2
if __name__ == '__main__':
  f1=open("D:/2.iso","rb")
  f2=open("E:/wenjian/1.iso","rb")
  print IsHashEqual(f1,f2)

计算2个文件的MD5值,大文件计算较慢

python对两个文本进行相同项筛选

import os
import os.path as osp
def filter(path):
  file_path = osp.join(path, 'index.txt')
  if osp.exists(file_path):
    return file_path
  index_file = open(file_path, 'a+')
  if not os.path.isdir(path):  #判断path是否为路径 
    return  
  for root, dirs, list in os.walk(path):
    for i in list: 
      dir = os.path.join(root, i)  #将分离的部分组成一个路径名 
      #if os.path.getsize(dir) < 60000:  #获取文件大小 
        #os.remove(dir)       #删除文件 
      print (i)
      index_file.write(i+'\n')
  index_file.close()    
def compare(path):
  file=osp.join(path, 'label.txt')
  file_path = osp.join(path, 'index.txt')
  with open(file_path, 'r') as file1:
     with open(file, 'r') as file2:
       same = set(file1).intersection(file2)
  same.discard('\n')
  with open('some_output_file.txt', 'w') as file_out:
     for line in same:
       file_out.write(line)
  file_out.close()
filter(r'D:\Desktop\jiaoben\ci')
compare(r'D:\Desktop\jiaoben\ci')

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,谢谢大家对三水点靠木的支持。如果你想了解更多相关内容请查看下面相关链接

Python 相关文章推荐
python多进程共享变量
Apr 06 Python
Win7下Python与Tensorflow-CPU版开发环境的安装与配置过程
Jan 04 Python
Python中将两个或多个list合成一个list的方法小结
May 12 Python
对python 调用类属性的方法详解
Jul 02 Python
python如何删除文件中重复的字段
Jul 16 Python
python实现PID算法及测试的例子
Aug 08 Python
Python处理session的方法整理
Aug 29 Python
python实现opencv+scoket网络实时图传
Mar 20 Python
推荐技术人员一款Python开源库(造数据神器)
Jul 08 Python
python的链表基础知识点
Sep 13 Python
Python函数调用追踪实现代码
Nov 27 Python
总结Pyinstaller打包的高级用法
Jun 28 Python
Python脚本按照当前日期创建多级目录
Mar 01 #Python
Python enumerate函数功能与用法示例
Mar 01 #Python
django模板加载静态文件的方法步骤
Mar 01 #Python
Python3中编码与解码之Unicode与bytes的讲解
Feb 28 #Python
Python multiprocessing多进程原理与应用示例
Feb 28 #Python
Python中的异常处理try/except/finally/raise用法分析
Feb 28 #Python
python使用phoenixdb操作hbase的方法示例
Feb 28 #Python
You might like
一段php加密解密的代码
2006/10/09 PHP
一个从别的网站抓取信息的例子(域名查询)
2006/10/09 PHP
PHP人民币金额数字转中文大写的函数代码
2013/02/27 PHP
Windows下的PHP安装pear教程
2014/10/24 PHP
php下的原生ajax请求用法实例分析
2020/02/28 PHP
document.all的一个比较完整的总结及案例
2013/01/31 Javascript
js 火狐下取本地路径实现思路
2013/04/02 Javascript
关于extjs4如何获取grid修改后的数据的问题
2013/08/07 Javascript
jquery快捷动态绑定键盘事件的操作函数代码
2013/10/17 Javascript
jQuery中removeClass()方法用法实例
2015/01/05 Javascript
jQuery 操作input中radio的技巧
2016/07/18 Javascript
JS原型链 详解及示例代码
2016/09/06 Javascript
用AngularJS来实现监察表单按钮的禁用效果
2016/11/02 Javascript
javascript实现滑动解锁功能
2017/03/22 Javascript
layui实现数据表格table分页功能(ajax异步)
2019/07/27 Javascript
vscode调试node.js的实现方法
2020/03/22 Javascript
基于JS实现视频上传显示进度条
2020/05/12 Javascript
vue在App.vue文件中监听路由变化刷新页面操作
2020/08/14 Javascript
[17:36]VG战队纪录片
2014/08/21 DOTA
[57:09]DOTA2-DPC中国联赛 正赛 Phoenix vs Dynasty BO3 第一场 1月26日
2021/03/11 DOTA
在Python中使用next()方法操作文件的教程
2015/05/24 Python
使用url_helper简化Python中Django框架的url配置教程
2015/05/30 Python
解决Python requests 报错方法集锦
2017/03/19 Python
使用Python实现文字转语音并生成wav文件的例子
2019/08/08 Python
Python matplotlib生成图片背景透明的示例代码
2019/08/30 Python
calendar在python3时间中常用函数举例详解
2020/11/18 Python
Pycharm 解决自动格式化冲突的设置操作
2021/01/15 Python
纯CSS3制作页面切换效果的实例代码
2019/05/30 HTML / CSS
基于HTML5新特性Mutation Observer实现编辑器的撤销和回退操作
2016/01/11 HTML / CSS
澳大利亚最受欢迎的超级商场每日优惠:Catch
2020/11/17 全球购物
毕业生个人的求职信范文
2013/12/03 职场文书
运动会解说词200字
2014/02/06 职场文书
庆元旦文艺演出主持词
2014/03/27 职场文书
起诉离婚协议书样本
2014/11/25 职场文书
二十年同学聚会感言
2015/07/30 职场文书
八年级英语教学反思
2016/02/15 职场文书