python去除文件中重复的行实例


Posted in Python onJune 29, 2018

python去除文件中重复的行,我们可以设置一个一个空list,res_list,用来加入没有出现过的字符行!

如果出现在res_list,我们就认为该行句子已经重复了,可以再加入到记录重复句子的list中。

如下代码:

# -*- coding: UTF-8 -*-
#程序功能是为了完成判断文件中是否有重复句子
#并将重复句子打印出来
 
res_list = []
#f = open('F:/master/master-work/code_of_graduate/LTP_data/raw_plain.txt','r')
f = open('F:/master/master-work/code_of_graduate/chu_li_shuju/ldc-weibo-train-res.txt','r')
res_dup = []
index = 0
file_dul = open('F:/master/master-work/code_of_graduate/chu_li_shuju/ldc-weibo-train-dul.txt', 'w')
for line in f.readlines():
 index = index + 1
 if line in res_list:
  temp_str = ""
  temp_str = temp_str + str(index)     #要变为str才行
  temp_line = ''.join(line)
  temp_str = temp_str+temp_line
  #最终要变为str类型
  file_dul.write(temp_str);       #将重复的存入到文件中
 else:
  res_list.append(line)

以上这篇python去除文件中重复的行实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python中合并两个文本文件并按照姓名首字母排序的例子
Apr 25 Python
使用Mixin设计模式进行Python编程的方法讲解
Jun 21 Python
你眼中的Python大牛 应该都有这份书单
Oct 31 Python
Python SqlAlchemy动态添加数据表字段实例解析
Feb 07 Python
python 对多个csv文件分别进行处理的方法
Jan 07 Python
python实现感知机线性分类模型示例代码
Jun 02 Python
提升Python效率之使用循环机制代替递归函数
Jul 23 Python
Python3通过chmod修改目录或文件权限的方法示例
Jun 08 Python
解决keras使用cov1D函数的输入问题
Jun 29 Python
python 匿名函数与三元运算学习笔记
Oct 23 Python
python实现简单猜单词游戏
Dec 24 Python
Python实现对齐打印 format函数的用法
Apr 28 Python
python获取指定字符串中重复模式最高的字符串方法
Jun 29 #Python
Python 利用内置set函数对字符串和列表进行去重的方法
Jun 29 #Python
Linux下python与C++使用dlib实现人脸检测
Jun 29 #Python
对python中两种列表元素去重函数性能的比较方法
Jun 29 #Python
Python数据持久化shelve模块用法分析
Jun 29 #Python
python 统计列表中不同元素的数量方法
Jun 29 #Python
python计算两个数的百分比方法
Jun 29 #Python
You might like
WordPress开发中用于标题显示的相关函数使用解析
2016/01/07 PHP
PHP如何读取由JavaScript设置的Cookie
2017/03/22 PHP
详解new function(){}和function(){}() 区别分析
2008/03/22 Javascript
动态为事件添加js代码示例
2009/02/15 Javascript
javascript使用eval或者new Function进行语法检查
2010/10/16 Javascript
Jquery跨域获得Json时invalid label错误的解决办法
2011/01/11 Javascript
jQuery实现按键盘方向键翻页特效
2015/03/18 Javascript
JQuery调用绑定click事件的3种写法
2015/03/28 Javascript
bootstrap监听滚动实现头部跟随滚动
2016/11/08 Javascript
适用于手机端的jQuery图片滑块动画
2016/12/09 Javascript
bootstrap table之通用方法( 时间控件,导出,动态下拉框, 表单验证 ,选中与获取信息)代码分享
2017/01/24 Javascript
原生JavaScript实现的简单省市县三级联动功能示例
2017/05/27 Javascript
JavaScript事件方法(实例讲解)
2017/06/27 Javascript
vue2.0+vue-router构建一个简单的列表页的示例代码
2019/02/13 Javascript
全面了解python字符串和字典
2016/07/07 Python
python dict 字典 以及 赋值 引用的一些实例(详解)
2017/01/20 Python
windows系统下Python环境搭建教程
2017/03/28 Python
django加载本地html的方法
2018/05/27 Python
python读取一个目录下所有txt里面的内容方法
2018/06/23 Python
Python使用pandas和xlsxwriter读写xlsx文件的方法示例
2019/04/09 Python
Python实现的北京积分落户数据分析示例
2020/03/27 Python
pycharm下pyqt4安装及环境配置的教程
2020/04/24 Python
Python调用高德API实现批量地址转经纬度并写入表格的功能
2021/01/12 Python
html5新增的属性和废除的属性简要概述
2013/02/20 HTML / CSS
潘多拉珠宝俄罗斯官方网上商店:PANDORA俄罗斯
2020/09/22 全球购物
如何在Oracle中查看各个表、表空间占用空间的大小
2015/10/31 面试题
淘宝客服专员岗位职责
2014/04/11 职场文书
公司员工安全协议书
2014/11/21 职场文书
2015年幼儿园元旦亲子活动方案
2014/12/09 职场文书
2015年考研复习计划
2015/01/19 职场文书
邀请函怎么写
2015/01/30 职场文书
2015年组织委员工作总结
2015/04/23 职场文书
2015年保卫科工作总结
2015/05/14 职场文书
CSS3 制作精美的定价表
2021/04/06 HTML / CSS
如何用JavaScript实现一个数组惰性求值库
2021/05/05 Javascript
Pytorch中expand()的使用(扩展某个维度)
2022/07/15 Python