python去除文件中重复的行实例


Posted in Python onJune 29, 2018

python去除文件中重复的行,我们可以设置一个一个空list,res_list,用来加入没有出现过的字符行!

如果出现在res_list,我们就认为该行句子已经重复了,可以再加入到记录重复句子的list中。

如下代码:

# -*- coding: UTF-8 -*-
#程序功能是为了完成判断文件中是否有重复句子
#并将重复句子打印出来
 
res_list = []
#f = open('F:/master/master-work/code_of_graduate/LTP_data/raw_plain.txt','r')
f = open('F:/master/master-work/code_of_graduate/chu_li_shuju/ldc-weibo-train-res.txt','r')
res_dup = []
index = 0
file_dul = open('F:/master/master-work/code_of_graduate/chu_li_shuju/ldc-weibo-train-dul.txt', 'w')
for line in f.readlines():
 index = index + 1
 if line in res_list:
  temp_str = ""
  temp_str = temp_str + str(index)     #要变为str才行
  temp_line = ''.join(line)
  temp_str = temp_str+temp_line
  #最终要变为str类型
  file_dul.write(temp_str);       #将重复的存入到文件中
 else:
  res_list.append(line)

以上这篇python去除文件中重复的行实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python使用scrapy解析js示例
Jan 23 Python
解决python使用open打开文件中文乱码的问题
Dec 29 Python
python放大图片和画方格实现算法
Mar 30 Python
Python实现基于PIL和tesseract的验证码识别功能示例
Jul 11 Python
python生成器与迭代器详解
Jan 01 Python
Python设计模式之观察者模式原理与用法详解
Jan 16 Python
详解python selenium 爬取网易云音乐歌单名
Mar 28 Python
python3.4+pycharm 环境安装及使用方法
Jun 13 Python
Python爬虫实现“盗取”微信好友信息的方法分析
Sep 16 Python
Python中BeautifuSoup库的用法使用详解
Nov 15 Python
python数据处理——对pandas进行数据变频或插值实例
Apr 22 Python
Python HTMLTestRunner如何下载生成报告
Sep 04 Python
python获取指定字符串中重复模式最高的字符串方法
Jun 29 #Python
Python 利用内置set函数对字符串和列表进行去重的方法
Jun 29 #Python
Linux下python与C++使用dlib实现人脸检测
Jun 29 #Python
对python中两种列表元素去重函数性能的比较方法
Jun 29 #Python
Python数据持久化shelve模块用法分析
Jun 29 #Python
python 统计列表中不同元素的数量方法
Jun 29 #Python
python计算两个数的百分比方法
Jun 29 #Python
You might like
PHP中通过语义URL防止网站被攻击的方法分享
2011/09/08 PHP
php生成局部唯一识别码LUID的代码
2012/10/06 PHP
PHP 面向对象程序设计(oop)学习笔记 (五) - PHP 命名空间
2014/06/12 PHP
PHP中$_SERVER使用说明
2015/07/05 PHP
php防止网站被攻击的应急代码
2015/10/21 PHP
Yii2使用dropdownlist实现地区三级联动功能的方法
2016/07/18 PHP
利用PHP获取访客IP、地区位置、浏览器及来源页面等信息
2017/06/27 PHP
通过PHP实现获取访问用户IP
2020/05/09 PHP
JavaScript 使用技巧精萃(.net html
2009/04/25 Javascript
js 固定悬浮效果实现思路代码
2013/08/02 Javascript
JS获取iframe中longdesc属性的方法
2015/04/01 Javascript
jQuery判断一个元素是否可见的方法
2015/06/05 Javascript
Three.js的使用及绘制基础3D图形详解
2017/04/27 Javascript
JavaScript限制在客户区可见范围的拖拽(解决scrollLeft和scrollTop的问题)(2)
2017/05/17 Javascript
vue.js实现刷新当前页面的方法教程
2017/07/05 Javascript
微信小程序支付之c#后台实现方法
2017/10/19 Javascript
浅析JavaScript异步代码优化
2019/03/18 Javascript
vue日历/日程提醒/html5本地缓存功能
2019/09/02 Javascript
[03:11]TI9战队档案 - Alliance
2019/08/20 DOTA
Python 调用DLL操作抄表机
2009/01/12 Python
python有证书的加密解密实现方法
2014/11/19 Python
Python2.x和3.x下maketrans与translate函数使用上的不同
2015/04/13 Python
python操作列表的函数使用代码详解
2017/12/28 Python
python3 图片referer防盗链的实现方法
2018/03/12 Python
用python3 返回鼠标位置的实现方法(带界面)
2019/07/05 Python
numpy 返回函数的上三角矩阵实例
2019/11/25 Python
python-sys.stdout作为默认函数参数的实现
2020/02/21 Python
浅谈Python中的字符串
2020/06/10 Python
网络教育自我鉴定
2013/11/01 职场文书
考试不及格检讨书
2014/01/09 职场文书
小学教师师德演讲稿
2014/05/06 职场文书
领导干部考核评语
2015/01/04 职场文书
2015年九一八事变纪念日演讲稿
2015/03/19 职场文书
2016小学优秀教师先进事迹材料
2016/02/26 职场文书
南阳市白酒市场的调查报告
2019/11/08 职场文书
Java 数组的使用
2022/05/11 Java/Android