python去除文件中重复的行实例


Posted in Python onJune 29, 2018

python去除文件中重复的行,我们可以设置一个一个空list,res_list,用来加入没有出现过的字符行!

如果出现在res_list,我们就认为该行句子已经重复了,可以再加入到记录重复句子的list中。

如下代码:

# -*- coding: UTF-8 -*-
#程序功能是为了完成判断文件中是否有重复句子
#并将重复句子打印出来
 
res_list = []
#f = open('F:/master/master-work/code_of_graduate/LTP_data/raw_plain.txt','r')
f = open('F:/master/master-work/code_of_graduate/chu_li_shuju/ldc-weibo-train-res.txt','r')
res_dup = []
index = 0
file_dul = open('F:/master/master-work/code_of_graduate/chu_li_shuju/ldc-weibo-train-dul.txt', 'w')
for line in f.readlines():
 index = index + 1
 if line in res_list:
  temp_str = ""
  temp_str = temp_str + str(index)     #要变为str才行
  temp_line = ''.join(line)
  temp_str = temp_str+temp_line
  #最终要变为str类型
  file_dul.write(temp_str);       #将重复的存入到文件中
 else:
  res_list.append(line)

以上这篇python去除文件中重复的行实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python Queue模块详细介绍及实例
Dec 27 Python
tensorflow输出权重值和偏差的方法
Feb 10 Python
python爬虫获取多页天涯帖子
Feb 23 Python
Python查找第n个子串的技巧分享
Jun 27 Python
pygame游戏之旅 创建游戏窗口界面
Nov 20 Python
Python实现的线性回归算法示例【附csv文件下载】
Dec 29 Python
解决python线程卡死的问题
Feb 18 Python
Pandas之MultiIndex对象的示例详解
Jun 25 Python
python射线法判断检测点是否位于区域外接矩形内
Jun 28 Python
Python编程中类与类的关系详解
Aug 08 Python
关于PyTorch源码解读之torchvision.models
Aug 17 Python
浅谈pytorch中stack和cat的及to_tensor的坑
May 20 Python
python获取指定字符串中重复模式最高的字符串方法
Jun 29 #Python
Python 利用内置set函数对字符串和列表进行去重的方法
Jun 29 #Python
Linux下python与C++使用dlib实现人脸检测
Jun 29 #Python
对python中两种列表元素去重函数性能的比较方法
Jun 29 #Python
Python数据持久化shelve模块用法分析
Jun 29 #Python
python 统计列表中不同元素的数量方法
Jun 29 #Python
python计算两个数的百分比方法
Jun 29 #Python
You might like
一个高ai的分页函数和一个url函数
2006/10/09 PHP
PHP中文件读、写、删的操作(PHP中对文件和目录操作)
2012/03/06 PHP
一个简单的网页密码登陆php代码
2012/07/17 PHP
PHP调用Linux命令权限不足问题解决方法
2015/02/07 PHP
PHP Reflection API详解
2015/05/12 PHP
纯php生成随机密码
2015/10/30 PHP
实例详解PHP中html word 互转的方法
2016/01/28 PHP
解决laravel中日志权限莫名变成了root的问题
2019/10/17 PHP
文本链接逐个出现的js脚本
2007/12/12 Javascript
Js setInterval与setTimeout(定时执行与循环执行)的代码(可以传入参数)
2010/06/11 Javascript
20款效果非常棒的 jQuery 插件小结分享
2011/11/18 Javascript
JS中Date日期函数中的参数使用介绍
2014/01/02 Javascript
jquery队列函数用法实例
2014/12/16 Javascript
jquery实现滑动特效代码
2015/08/10 Javascript
jQuery三级下拉列表导航菜单代码分享
2020/04/15 Javascript
js生成随机颜色方法代码分享(三种)
2016/12/29 Javascript
Vue数据驱动模拟实现1
2017/01/11 Javascript
详解Angular-ui-BootStrap组件的解释以及使用
2018/07/13 Javascript
利用不到200行代码写一款属于你自己的js类库
2019/07/08 Javascript
小程序中使用css var变量(使js可以动态设置css样式属性)
2020/03/31 Javascript
js实现列表按字母排序
2020/08/11 Javascript
vue router-link 默认a标签去除下划线的实现
2020/11/06 Javascript
剖析Python的Tornado框架中session支持的实现代码
2015/08/21 Python
Python数据类型详解(三)元祖:tuple
2016/05/08 Python
一个Python最简单的接口自动化框架
2018/01/02 Python
通过cmd进入python的实例操作
2019/06/26 Python
python3实现带多张图片、附件的邮件发送
2019/08/10 Python
详解Python文件修改的两种方式
2019/08/22 Python
pytorch实现用CNN和LSTM对文本进行分类方式
2020/01/08 Python
Python抓新型冠状病毒肺炎疫情数据并绘制全国疫情分布的代码实例
2020/02/05 Python
python怎么删除缓存文件
2020/07/19 Python
求最大连续递增数字串(如"ads3sl456789DF3456ld345AA"中的"456789")
2015/09/11 面试题
最新结婚典礼主持词
2014/03/14 职场文书
教师节联欢会主持词
2015/07/04 职场文书
Python WSGI 规范简介
2021/04/11 Python
python脚本框架webpy模板赋值实现
2021/11/20 Python