python 判断txt每行内容中是否包含子串并重新写入保存的实例


Posted in Python onMarch 12, 2020

假设需要批量处理多个txt文件,然后将包含子串的内容写入一个txt文件中,这里假设我的子串为"_9"和“_10”

python 判断txt每行内容中是否包含子串并重新写入保存的实例

下面就是我想要得到的其中两行内容(实际上还有很多行哈哈):

python 判断txt每行内容中是否包含子串并重新写入保存的实例

直接上代码:

#! /usr/bin/python
# -*- coding:UTF-8 -*-
 
import os
import os.path
import string

txt文件所在的路径和需要保存的目标路径(根据自己的实际目录进行更改即可):

Crop-Ocr_txt文件夹内放置了我需要批量处理的所有txt,我在同级目录下新建一个文件夹名为1000_simple_Ocrtxts,这里目标路径随意就好,能方便找到就行

txt_path = 'D:/youxinProjections/trafic-youxin/MobileNet_v1/obtain_qq_json_new/Crop_Ocr_txt/'
des_txt_path = 'D:/youxinProjections/trafic-youxin/MobileNet_v1/obtain_qq_json_new/1000_simple_OCRtxts/'
 
txt_files = os.listdir(txt_path) #txt_files能得到该目录下的所有txt文件的文件名

定义一个函数专门用来取包含子串的内容并写入到新的txt文件中,在后边的主函数中直接调用这个函数就行就行:

def select_simples():
  for txtfile in txt_files:
    if not os.path.isdir(txtfile):
      in_file = open(txt_path + txtfile, 'r')
      out_file = open(des_txt_path + txtfile, 'a') # 此处自动新建一个文件夹和txtfile的文件名相同,'a'为自动换行写入
      lines = in_file.readlines()
      for line in lines:
        str_name = line.split(" ")[0] # 这里获取的是txt文件中每行内容以空格隔开的第一个元素,也就是我自己txt文件中的*.jpg那一块内容
str1 = '_9' # 这就是我要判断的子串
        str2 = '_10' # 这也是子串
 
        #if (string.find(str_name, str1)!=-1) or (string.find(str_name, str2)):
        if (str1 in str_name) or (str2 in str_name): # in 可以判断在str_name中是否包含有两个子串,
          out_file.write(line) # 若包含子串,则将该行内容全部重新写入新的txt文件
          print(str_name)
      out_file.close()

主函数到了!:

if __name__ == '__main__':
select_simples()

晒一下最后的结果:

python 判断txt每行内容中是否包含子串并重新写入保存的实例

完美有没有!!!

补充知识:python判断文件中有否重复行,逐行读文件检测另一文件中是否存在所读内容

我就废话不多说了,还是直接看代码吧!

#!/bin/env python
# coding:utf-8
#程序功能是为了完成判断文件中是否有重复句子
#并将重复句子打印出来

res_list = []
f = open('./downloadmd5.txt','r')
res_dup = []
index = 0
file_dul = open('./r_d.txt', 'w')
file_last = open('./r_nd.txt','w')
for line in f.readlines():
  index = index + 1
  if line in res_list:
    temp_str = ""
    #temp_str = temp_str + str(index) + ','  #要变为str才行
    temp_line = ''.join(line)
    temp_str = temp_str+temp_line
    #最终要变为str类型
    file_dul.write(temp_str);         #将重复的存入到文件中
  else:
    res_list.append(line)
    file_last.write(line)
#!/bin/env python
# coding:utf-8
import re

res_list = []
f = open('./md5.txt','r')
f2 = open('./virus.conf','r')

index = 0
#没重复的文件名
file_dul = open('./m_nd.txt', 'w')
#重复的文件名
file_ex = open('./m_d.txt', 'w')

virstr = f2.read();
for line in f.readlines():
  line=line.strip('\n')
  if(re.search(line, virstr)):
    line = line + '\n'
    file_ex.write(line);
    #调用删除rm -rf filename
  else:
    line = line+'\n'
    file_dul.write(line);

以上这篇python 判断txt每行内容中是否包含子串并重新写入保存的实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
简单了解什么是神经网络
Dec 23 Python
解决python中使用plot画图,图不显示的问题
Jul 04 Python
对dataframe数据之间求补集的实例详解
Jan 30 Python
对python中不同模块(函数、类、变量)的调用详解
Jul 16 Python
python点击鼠标获取坐标(Graphics)
Aug 10 Python
Python字典的概念及常见应用实例详解
Oct 30 Python
python自动生成model文件过程详解
Nov 02 Python
Pandas数据离散化原理及实例解析
Nov 16 Python
基于python 等频分箱qcut问题的解决
Mar 03 Python
浅谈Python程序的错误:变量未定义
Jun 02 Python
使用python求斐波那契数列中第n个数的值示例代码
Jul 26 Python
详解Python+OpenCV绘制灰度直方图
Mar 22 Python
python 两个一样的字符串用==结果为false问题的解决
Mar 12 #Python
python不相等的两个字符串的 if 条件判断为True详解
Mar 12 #Python
Python 实现使用空值进行赋值 None
Mar 12 #Python
PyCharm永久激活方式(推荐)
Sep 22 #Python
Pycharm激活码激活两种快速方式(附最新激活码和插件)
Mar 12 #Python
pycharm激活码快速激活及使用步骤
Mar 12 #Python
Python自动化测试笔试面试题精选
Mar 12 #Python
You might like
探讨:如何使用PhpDocumentor生成文档
2013/06/25 PHP
PHP语法自动检查的Vim插件
2014/08/11 PHP
PHP中实现crontab代码分享
2015/03/26 PHP
详解WordPress中分类函数wp_list_categories的使用
2016/01/04 PHP
根据判断浏览器类型屏幕分辨率自动调用不同CSS的代码
2007/02/22 Javascript
pjblog修改技巧汇总
2007/03/12 Javascript
js onpropertychange输入框 事件获取属性
2009/03/26 Javascript
js 匿名调用实现代码
2009/06/19 Javascript
js下利用控制器载入对应脚本
2010/07/17 Javascript
Javascript变量函数浅析
2011/09/02 Javascript
JS数组去重与取重的示例代码
2014/01/24 Javascript
jQuery之Deferred对象详解
2014/09/04 Javascript
在JavaScript中使用NaN值的方法
2015/06/05 Javascript
浅谈jquery.fn.extend与jquery.extend区别
2015/07/13 Javascript
js选项卡的制作方法
2017/01/23 Javascript
JavaScript实现兼容IE6的收起折叠与展开效果实例
2017/09/20 Javascript
纯JS实现可用于页码更换的飞页特效示例
2018/05/21 Javascript
Vue Prop属性功能与用法实例详解
2019/02/23 Javascript
详解jQuery设置内容和属性
2019/04/11 jQuery
简述Vue中容易被忽视的知识点
2019/12/09 Javascript
启动Atom并运行python文件的步骤
2018/11/09 Python
Python常见读写文件操作实例总结【文本、json、csv、pdf等】
2019/04/15 Python
Python Socket多线程并发原理及实现
2020/12/11 Python
CSS3贝塞尔曲线示例:创建链接悬停动画效果
2020/11/19 HTML / CSS
英国汽车零件购物网站:GSF Car Parts
2019/05/23 全球购物
俄罗斯家居用品购物网站:Евродом
2020/11/21 全球购物
北京振戎融通Java面试题
2015/09/03 面试题
网吧收银员岗位职责
2013/12/14 职场文书
酒店led欢迎词
2014/01/09 职场文书
违纪检讨书2000字
2014/02/08 职场文书
物业管理专业自荐信
2014/07/01 职场文书
结婚通知短信怎么写
2015/04/17 职场文书
最感人的道歉情书
2015/05/12 职场文书
《小蝌蚪找妈妈》教学反思
2016/02/23 职场文书
2016年感恩父亲节活动总结
2016/04/01 职场文书
解决Mysql报错 Table 'mysql.user' doesn't exist
2022/05/06 MySQL