python去除文件中重复的行实例


Posted in Python onJune 29, 2018

python去除文件中重复的行,我们可以设置一个一个空list,res_list,用来加入没有出现过的字符行!

如果出现在res_list,我们就认为该行句子已经重复了,可以再加入到记录重复句子的list中。

如下代码:

# -*- coding: UTF-8 -*-
#程序功能是为了完成判断文件中是否有重复句子
#并将重复句子打印出来
 
res_list = []
#f = open('F:/master/master-work/code_of_graduate/LTP_data/raw_plain.txt','r')
f = open('F:/master/master-work/code_of_graduate/chu_li_shuju/ldc-weibo-train-res.txt','r')
res_dup = []
index = 0
file_dul = open('F:/master/master-work/code_of_graduate/chu_li_shuju/ldc-weibo-train-dul.txt', 'w')
for line in f.readlines():
 index = index + 1
 if line in res_list:
  temp_str = ""
  temp_str = temp_str + str(index)     #要变为str才行
  temp_line = ''.join(line)
  temp_str = temp_str+temp_line
  #最终要变为str类型
  file_dul.write(temp_str);       #将重复的存入到文件中
 else:
  res_list.append(line)

以上这篇python去除文件中重复的行实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python实现一个转存纯真IP数据库的脚本分享
May 21 Python
python win32 简单操作方法
May 25 Python
Python 关于反射和类的特殊成员方法
Sep 14 Python
python实现机器人行走效果
Jan 29 Python
Python不同目录间进行模块调用的实现方法
Jan 29 Python
python中hasattr()、getattr()、setattr()函数的使用
Aug 16 Python
Python读取YAML文件过程详解
Dec 30 Python
用Python做一个久坐提醒小助手的示例代码
Feb 10 Python
如何使用repr调试python程序
Feb 28 Python
python numpy实现多次循环读取文件 等间隔过滤数据示例
Mar 14 Python
keras中的History对象用法
Jun 19 Python
Jupyter Notebook 安装配置与使用详解
Jan 06 Python
python获取指定字符串中重复模式最高的字符串方法
Jun 29 #Python
Python 利用内置set函数对字符串和列表进行去重的方法
Jun 29 #Python
Linux下python与C++使用dlib实现人脸检测
Jun 29 #Python
对python中两种列表元素去重函数性能的比较方法
Jun 29 #Python
Python数据持久化shelve模块用法分析
Jun 29 #Python
python 统计列表中不同元素的数量方法
Jun 29 #Python
python计算两个数的百分比方法
Jun 29 #Python
You might like
php实现删除指定目录下相关文件的方法
2014/10/20 PHP
Joomla调用系统自带编辑器的实现方法
2016/05/05 PHP
JavaScript 浮点数运算 精度问题
2009/10/06 Javascript
基于jQuery实现放大镜特效
2020/10/19 Javascript
简洁实用的BootStrap jQuery手风琴插件
2016/08/31 Javascript
jQuery中clone()函数实现表单中增加和减少输入项
2017/05/13 jQuery
微信小程序版翻牌小游戏
2018/01/26 Javascript
vue引入js数字小键盘的实现代码
2018/05/14 Javascript
JS实现面向对象继承的5种方式分析
2018/07/21 Javascript
vue项目中监听手机物理返回键的实现
2020/01/18 Javascript
全网小程序接口请求封装实例代码
2020/11/06 Javascript
[27:53]2014 DOTA2华西杯精英邀请赛 5 24 NewBee VS iG
2014/05/26 DOTA
[01:00:25]2018DOTA2亚洲邀请赛3月30日 小组赛A组 VG VS Liquid
2018/03/31 DOTA
Python做文本按行去重的实现方法
2016/10/19 Python
Python中实现switch功能实例解析
2018/01/11 Python
对python创建及引用动态变量名的示例讲解
2018/11/10 Python
python实现可逆简单的加密算法
2019/03/22 Python
python粘包问题及socket套接字编程详解
2019/06/29 Python
使用Python轻松完成垃圾分类(基于图像识别)
2019/07/09 Python
linux下python中文乱码解决方案详解
2019/08/28 Python
python实现简单学生信息管理系统
2020/04/09 Python
Python浮点型(float)运算结果不正确的解决方案
2020/09/22 Python
Spartoo瑞典:鞋子、包包和衣服
2018/09/15 全球购物
HelloFresh奥地利:立即订购烹饪盒
2019/02/22 全球购物
骨干教师培训感言
2014/01/16 职场文书
行政工作个人的自我评价
2014/02/13 职场文书
创建卫生先进单位实施方案
2014/03/10 职场文书
酒店员工培训方案
2014/06/02 职场文书
股指期货心得体会
2014/09/10 职场文书
四风问题对照检查材料
2014/09/22 职场文书
义卖募捐活动总结
2015/05/09 职场文书
在职证明书模板
2015/06/15 职场文书
学习弘扬焦裕禄精神心得体会
2016/01/23 职场文书
导游词之崇武古城
2019/10/07 职场文书
python 三边测量定位的实现代码
2021/04/22 Python
项目中Nginx多级代理是如何获取客户端的真实IP地址
2022/05/30 Servers