python 判断txt每行内容中是否包含子串并重新写入保存的实例


Posted in Python onMarch 12, 2020

假设需要批量处理多个txt文件,然后将包含子串的内容写入一个txt文件中,这里假设我的子串为"_9"和“_10”

python 判断txt每行内容中是否包含子串并重新写入保存的实例

下面就是我想要得到的其中两行内容(实际上还有很多行哈哈):

python 判断txt每行内容中是否包含子串并重新写入保存的实例

直接上代码:

#! /usr/bin/python
# -*- coding:UTF-8 -*-
 
import os
import os.path
import string

txt文件所在的路径和需要保存的目标路径(根据自己的实际目录进行更改即可):

Crop-Ocr_txt文件夹内放置了我需要批量处理的所有txt,我在同级目录下新建一个文件夹名为1000_simple_Ocrtxts,这里目标路径随意就好,能方便找到就行

txt_path = 'D:/youxinProjections/trafic-youxin/MobileNet_v1/obtain_qq_json_new/Crop_Ocr_txt/'
des_txt_path = 'D:/youxinProjections/trafic-youxin/MobileNet_v1/obtain_qq_json_new/1000_simple_OCRtxts/'
 
txt_files = os.listdir(txt_path) #txt_files能得到该目录下的所有txt文件的文件名

定义一个函数专门用来取包含子串的内容并写入到新的txt文件中,在后边的主函数中直接调用这个函数就行就行:

def select_simples():
  for txtfile in txt_files:
    if not os.path.isdir(txtfile):
      in_file = open(txt_path + txtfile, 'r')
      out_file = open(des_txt_path + txtfile, 'a') # 此处自动新建一个文件夹和txtfile的文件名相同,'a'为自动换行写入
      lines = in_file.readlines()
      for line in lines:
        str_name = line.split(" ")[0] # 这里获取的是txt文件中每行内容以空格隔开的第一个元素,也就是我自己txt文件中的*.jpg那一块内容
str1 = '_9' # 这就是我要判断的子串
        str2 = '_10' # 这也是子串
 
        #if (string.find(str_name, str1)!=-1) or (string.find(str_name, str2)):
        if (str1 in str_name) or (str2 in str_name): # in 可以判断在str_name中是否包含有两个子串,
          out_file.write(line) # 若包含子串,则将该行内容全部重新写入新的txt文件
          print(str_name)
      out_file.close()

主函数到了!:

if __name__ == '__main__':
select_simples()

晒一下最后的结果:

python 判断txt每行内容中是否包含子串并重新写入保存的实例

完美有没有!!!

补充知识:python判断文件中有否重复行,逐行读文件检测另一文件中是否存在所读内容

我就废话不多说了,还是直接看代码吧!

#!/bin/env python
# coding:utf-8
#程序功能是为了完成判断文件中是否有重复句子
#并将重复句子打印出来

res_list = []
f = open('./downloadmd5.txt','r')
res_dup = []
index = 0
file_dul = open('./r_d.txt', 'w')
file_last = open('./r_nd.txt','w')
for line in f.readlines():
  index = index + 1
  if line in res_list:
    temp_str = ""
    #temp_str = temp_str + str(index) + ','  #要变为str才行
    temp_line = ''.join(line)
    temp_str = temp_str+temp_line
    #最终要变为str类型
    file_dul.write(temp_str);         #将重复的存入到文件中
  else:
    res_list.append(line)
    file_last.write(line)
#!/bin/env python
# coding:utf-8
import re

res_list = []
f = open('./md5.txt','r')
f2 = open('./virus.conf','r')

index = 0
#没重复的文件名
file_dul = open('./m_nd.txt', 'w')
#重复的文件名
file_ex = open('./m_d.txt', 'w')

virstr = f2.read();
for line in f.readlines():
  line=line.strip('\n')
  if(re.search(line, virstr)):
    line = line + '\n'
    file_ex.write(line);
    #调用删除rm -rf filename
  else:
    line = line+'\n'
    file_dul.write(line);

以上这篇python 判断txt每行内容中是否包含子串并重新写入保存的实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python列表生成器的循环技巧分享
Mar 06 Python
举例讲解Python中的身份运算符的使用方法
Oct 13 Python
【Python】Python的urllib模块、urllib2模块批量进行网页下载文件
Nov 19 Python
Python实现获取邮箱内容并解析的方法示例
Jun 16 Python
Python简单爬虫导出CSV文件的实例讲解
Jul 06 Python
对python中的six.moves模块的下载函数urlretrieve详解
Dec 19 Python
Python 占位符的使用方法详解
Jul 10 Python
python lambda表达式在sort函数中的使用详解
Aug 28 Python
Python Django框架url反向解析实现动态生成对应的url链接示例
Oct 18 Python
在Python中使用filter去除列表中值为假及空字符串的例子
Nov 18 Python
Python爬取腾讯视频评论的思路详解
Dec 19 Python
Python调用shell命令常用方法(4种)
May 11 Python
python 两个一样的字符串用==结果为false问题的解决
Mar 12 #Python
python不相等的两个字符串的 if 条件判断为True详解
Mar 12 #Python
Python 实现使用空值进行赋值 None
Mar 12 #Python
PyCharm永久激活方式(推荐)
Sep 22 #Python
Pycharm激活码激活两种快速方式(附最新激活码和插件)
Mar 12 #Python
pycharm激活码快速激活及使用步骤
Mar 12 #Python
Python自动化测试笔试面试题精选
Mar 12 #Python
You might like
PHP程序61条面向对象分析设计的经验小结
2008/11/12 PHP
php文章内容分页并生成相应的htm静态页面代码
2010/06/07 PHP
二招解决php乱码问题
2012/03/25 PHP
Codeigniter的一些优秀特性总结
2015/01/21 PHP
PHP入门教程之面向对象基本概念实例分析
2016/09/11 PHP
php+resumablejs实现的分块上传 断点续传功能示例
2017/04/18 PHP
jquery $.ajax各个事件执行顺序
2010/10/15 Javascript
JS限制上传图片大小不使用控件在本地实现
2012/12/19 Javascript
JavaScript 模拟类机制及私有变量的方法及思路
2013/07/10 Javascript
jquery实现可横向和竖向展开的动态下滑菜单效果
2015/08/24 Javascript
js判断手机号运营商的方法
2015/10/23 Javascript
JavaScript中误用/g导致的正则test()无法正确重复执行的解决方案
2016/07/27 Javascript
Bootstrap 实现查询的完美方法
2016/10/26 Javascript
基于Vue的文字跑马灯组件(npm 组件包)
2017/05/24 Javascript
angular使用bootstrap方法手动启动的实例代码
2017/07/18 Javascript
javascript中的replace函数(带注释demo)
2018/01/07 Javascript
Javascript 编码约定(编码规范)
2018/03/11 Javascript
Vue面试题及Vue知识点整理
2018/10/07 Javascript
JS实现求字符串中出现最多次数的字符和次数示例
2019/07/05 Javascript
react使用antd表单赋值,用于修改弹框的操作
2020/10/29 Javascript
JavaScript实现原型封装轮播图
2020/12/27 Javascript
Python3搜索及替换文件中文本的方法
2015/05/22 Python
python相似模块用例
2016/03/04 Python
python3爬虫怎样构建请求header
2018/12/23 Python
django的auth认证,authenticate和装饰器功能详解
2019/07/25 Python
python属于解释语言吗
2020/06/11 Python
Delphi CS笔试题
2014/01/04 面试题
艺术设计专业个人求职信
2013/09/21 职场文书
偷看我的初中毕业鉴定
2014/01/29 职场文书
《寓言两则》教学反思
2014/02/27 职场文书
《散步》教学反思
2014/03/02 职场文书
2014迎接教师节演讲稿
2014/09/10 职场文书
银行开户授权委托书格式
2014/10/10 职场文书
原料仓管员岗位职责
2015/04/01 职场文书
信用卡工资证明范本
2015/06/19 职场文书
保险公司2016开门红口号集锦
2015/12/24 职场文书