python去除文件中重复的行实例


Posted in Python onJune 29, 2018

python去除文件中重复的行,我们可以设置一个一个空list,res_list,用来加入没有出现过的字符行!

如果出现在res_list,我们就认为该行句子已经重复了,可以再加入到记录重复句子的list中。

如下代码:

# -*- coding: UTF-8 -*-
#程序功能是为了完成判断文件中是否有重复句子
#并将重复句子打印出来
 
res_list = []
#f = open('F:/master/master-work/code_of_graduate/LTP_data/raw_plain.txt','r')
f = open('F:/master/master-work/code_of_graduate/chu_li_shuju/ldc-weibo-train-res.txt','r')
res_dup = []
index = 0
file_dul = open('F:/master/master-work/code_of_graduate/chu_li_shuju/ldc-weibo-train-dul.txt', 'w')
for line in f.readlines():
 index = index + 1
 if line in res_list:
  temp_str = ""
  temp_str = temp_str + str(index)     #要变为str才行
  temp_line = ''.join(line)
  temp_str = temp_str+temp_line
  #最终要变为str类型
  file_dul.write(temp_str);       #将重复的存入到文件中
 else:
  res_list.append(line)

以上这篇python去除文件中重复的行实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python使用pil生成缩略图的方法
Mar 26 Python
详解如何用OpenCV + Python 实现人脸识别
Oct 20 Python
python处理数据,存进hive表的方法
Jul 04 Python
Python3爬虫之urllib携带cookie爬取网页的方法
Dec 28 Python
使用python list 查找所有匹配元素的位置实例
Jun 11 Python
将Pytorch模型从CPU转换成GPU的实现方法
Aug 19 Python
Python.append()与Python.expand()用法详解
Dec 18 Python
django正续或者倒序查库实例
May 19 Python
解决numpy矩阵相减出现的负值自动转正值的问题
Jun 03 Python
Python基于wordcloud及jieba实现中国地图词云图
Jun 09 Python
详解使用scrapy进行模拟登陆三种方式
Feb 21 Python
Python通用验证码识别OCR库ddddocr的安装使用教程
Jul 07 Python
python获取指定字符串中重复模式最高的字符串方法
Jun 29 #Python
Python 利用内置set函数对字符串和列表进行去重的方法
Jun 29 #Python
Linux下python与C++使用dlib实现人脸检测
Jun 29 #Python
对python中两种列表元素去重函数性能的比较方法
Jun 29 #Python
Python数据持久化shelve模块用法分析
Jun 29 #Python
python 统计列表中不同元素的数量方法
Jun 29 #Python
python计算两个数的百分比方法
Jun 29 #Python
You might like
php获取某个目录大小的代码
2008/09/10 PHP
php入门学习知识点六 PHP文件的读写操作代码
2011/07/14 PHP
ECshop 迁移到 PHP7版本时遇到的兼容性问题
2016/02/15 PHP
php微信公众号开发之快递查询
2018/10/20 PHP
js css样式操作代码(批量操作)
2009/10/09 Javascript
js创建对象的几种常用方式小结(推荐)
2010/10/24 Javascript
Jquery 表单验证类介绍与实例
2013/06/09 Javascript
Node.js中使用Buffer编码、解码二进制数据详解
2014/08/16 Javascript
基于jQuery创建鼠标悬停效果的方法
2015/03/07 Javascript
JQuery实现动态适时改变字体颜色的方法
2015/03/10 Javascript
javascript获取select值的方法分析
2015/07/02 Javascript
jquery实现简洁文件上传表单样式
2015/11/02 Javascript
js获取form表单所有数据的简单方法
2016/08/18 Javascript
AngularJS  ng-repeat遍历输出的用法
2017/06/19 Javascript
Vuejs 页面的区域化与组件封装的实现
2017/09/11 Javascript
mui上拉加载更多下拉刷新数据的封装过程
2017/11/03 Javascript
jquery中done和then的区别(详解)
2017/12/19 jQuery
js中document.write和document.writeln的区别
2018/03/11 Javascript
小程序实现多列选择器
2019/02/15 Javascript
javascript设计模式 ? 观察者模式原理与用法实例分析
2020/04/22 Javascript
Python获取远程文件大小的函数代码分享
2014/05/13 Python
详解详解Python中writelines()方法的使用
2015/05/25 Python
Python中list列表的一些进阶使用方法介绍
2015/08/15 Python
python创建学生成绩管理系统
2019/11/22 Python
PHP基于phpqrcode类库生成二维码过程解析
2020/05/28 Python
Python制作一个仿QQ办公版的图形登录界面
2020/09/22 Python
Merchant 1948澳大利亚:新西兰领先的鞋类和靴子供应商
2018/03/24 全球购物
英国Boots旗下太阳镜网站:Boots Designer Sunglasses
2018/07/07 全球购物
Bluebella德国官网:英国性感内衣和睡衣品牌
2019/11/08 全球购物
AssertionError 跟一下那个类是 “is – a”的关系
2012/02/21 面试题
毕业生应聘求职信
2014/07/10 职场文书
农村党员对照检查材料
2014/09/24 职场文书
学校社团活动总结
2015/05/07 职场文书
车辆挂靠协议书
2016/03/23 职场文书
SQL Server 数据库实验课第五周——常用查询条件
2021/04/05 SQL Server
Python实现灰色关联分析与结果可视化的详细代码
2022/03/25 Python