python去除文件中重复的行实例


Posted in Python onJune 29, 2018

python去除文件中重复的行,我们可以设置一个一个空list,res_list,用来加入没有出现过的字符行!

如果出现在res_list,我们就认为该行句子已经重复了,可以再加入到记录重复句子的list中。

如下代码:

# -*- coding: UTF-8 -*-
#程序功能是为了完成判断文件中是否有重复句子
#并将重复句子打印出来
 
res_list = []
#f = open('F:/master/master-work/code_of_graduate/LTP_data/raw_plain.txt','r')
f = open('F:/master/master-work/code_of_graduate/chu_li_shuju/ldc-weibo-train-res.txt','r')
res_dup = []
index = 0
file_dul = open('F:/master/master-work/code_of_graduate/chu_li_shuju/ldc-weibo-train-dul.txt', 'w')
for line in f.readlines():
 index = index + 1
 if line in res_list:
  temp_str = ""
  temp_str = temp_str + str(index)     #要变为str才行
  temp_line = ''.join(line)
  temp_str = temp_str+temp_line
  #最终要变为str类型
  file_dul.write(temp_str);       #将重复的存入到文件中
 else:
  res_list.append(line)

以上这篇python去除文件中重复的行实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python判断windows隐藏文件的方法
Mar 21 Python
python入门基础之用户输入与模块初认识
Nov 14 Python
使用Python生成XML的方法实例
Mar 21 Python
Python语言描述KNN算法与Kd树
Dec 13 Python
Python根据已知邻接矩阵绘制无向图操作示例
Jun 23 Python
python opencv读mp4视频的实例
Dec 07 Python
python opencv 批量改变图片的尺寸大小的方法
Jun 28 Python
如何在Django配置文件里配置session链接
Aug 06 Python
Python3实现二叉树的最大深度
Sep 30 Python
pytorch使用tensorboardX进行loss可视化实例
Feb 24 Python
python使用turtle库绘制奥运五环
Feb 24 Python
python torch.utils.data.DataLoader使用方法
Apr 02 Python
python获取指定字符串中重复模式最高的字符串方法
Jun 29 #Python
Python 利用内置set函数对字符串和列表进行去重的方法
Jun 29 #Python
Linux下python与C++使用dlib实现人脸检测
Jun 29 #Python
对python中两种列表元素去重函数性能的比较方法
Jun 29 #Python
Python数据持久化shelve模块用法分析
Jun 29 #Python
python 统计列表中不同元素的数量方法
Jun 29 #Python
python计算两个数的百分比方法
Jun 29 #Python
You might like
sourcesafe管理phpproj文件的补充说明(downmoon)
2009/04/11 PHP
yii2.0实现验证用户名与邮箱功能
2015/12/22 PHP
php求今天、昨天、明天时间戳的简单实现方法
2016/07/28 PHP
laravel框架关于搜索功能的实现
2018/03/15 PHP
Laravel推荐使用的十个辅助函数
2019/05/10 PHP
Laravel框架验证码类用法实例分析
2019/09/11 PHP
jQuery动态添加 input type=file的实现代码
2012/06/14 Javascript
textarea 控制输入字符字节数(示例代码)
2013/12/27 Javascript
限制上传文件大小和格式的jQuery插件实例
2015/01/24 Javascript
JavaScript实现文字跟随鼠标特效
2015/08/06 Javascript
JavaScript设计模式初探
2016/01/07 Javascript
jQuery 3.0 的变化及使用方法
2016/02/01 Javascript
Vue的土著指令和自定义指令实例详解
2018/02/04 Javascript
ng-zorro-antd 入门初体验
2018/12/03 Javascript
jQuery模仿ToDoList实现简单的待办事项列表
2019/12/30 jQuery
如何解决django配置settings时遇到Could not import settings 'conf.local'
2014/11/18 Python
python中子类继承父类的__init__方法实例
2016/12/15 Python
Django基于ORM操作数据库的方法详解
2018/03/27 Python
Python逐行读取文件中内容的简单方法
2019/02/26 Python
pycharm访问mysql数据库的方法步骤
2019/06/18 Python
Python使用mongodb保存爬取豆瓣电影的数据过程解析
2019/08/14 Python
python构造IP报文实例
2020/05/05 Python
俄罗斯在线服装店:STOLNIK
2021/03/07 全球购物
澳洲最大的时尚奢侈品电商平台:Cettire
2020/06/15 全球购物
英国Iceland杂货店:网上食品购物
2020/12/16 全球购物
北京SQL新华信咨询
2016/09/30 面试题
自我鉴定范文300字
2013/10/01 职场文书
机械系大学毕业生推荐信
2013/11/27 职场文书
装修设计师求职信
2014/02/26 职场文书
企业标语大全
2014/07/01 职场文书
银行竞聘报告范文
2014/11/06 职场文书
破坏寝室公物检讨书
2014/11/17 职场文书
装饰技术负责人岗位职责
2015/04/13 职场文书
入学证明
2015/06/23 职场文书
Mysql systemctl start mysqld报错的问题解决
2021/06/03 MySQL
分析MySQL优化 index merge 后引起的死锁
2022/04/19 MySQL