python 判断txt每行内容中是否包含子串并重新写入保存的实例


Posted in Python onMarch 12, 2020

假设需要批量处理多个txt文件,然后将包含子串的内容写入一个txt文件中,这里假设我的子串为"_9"和“_10”

python 判断txt每行内容中是否包含子串并重新写入保存的实例

下面就是我想要得到的其中两行内容(实际上还有很多行哈哈):

python 判断txt每行内容中是否包含子串并重新写入保存的实例

直接上代码:

#! /usr/bin/python
# -*- coding:UTF-8 -*-
 
import os
import os.path
import string

txt文件所在的路径和需要保存的目标路径(根据自己的实际目录进行更改即可):

Crop-Ocr_txt文件夹内放置了我需要批量处理的所有txt,我在同级目录下新建一个文件夹名为1000_simple_Ocrtxts,这里目标路径随意就好,能方便找到就行

txt_path = 'D:/youxinProjections/trafic-youxin/MobileNet_v1/obtain_qq_json_new/Crop_Ocr_txt/'
des_txt_path = 'D:/youxinProjections/trafic-youxin/MobileNet_v1/obtain_qq_json_new/1000_simple_OCRtxts/'
 
txt_files = os.listdir(txt_path) #txt_files能得到该目录下的所有txt文件的文件名

定义一个函数专门用来取包含子串的内容并写入到新的txt文件中,在后边的主函数中直接调用这个函数就行就行:

def select_simples():
  for txtfile in txt_files:
    if not os.path.isdir(txtfile):
      in_file = open(txt_path + txtfile, 'r')
      out_file = open(des_txt_path + txtfile, 'a') # 此处自动新建一个文件夹和txtfile的文件名相同,'a'为自动换行写入
      lines = in_file.readlines()
      for line in lines:
        str_name = line.split(" ")[0] # 这里获取的是txt文件中每行内容以空格隔开的第一个元素,也就是我自己txt文件中的*.jpg那一块内容
str1 = '_9' # 这就是我要判断的子串
        str2 = '_10' # 这也是子串
 
        #if (string.find(str_name, str1)!=-1) or (string.find(str_name, str2)):
        if (str1 in str_name) or (str2 in str_name): # in 可以判断在str_name中是否包含有两个子串,
          out_file.write(line) # 若包含子串,则将该行内容全部重新写入新的txt文件
          print(str_name)
      out_file.close()

主函数到了!:

if __name__ == '__main__':
select_simples()

晒一下最后的结果:

python 判断txt每行内容中是否包含子串并重新写入保存的实例

完美有没有!!!

补充知识:python判断文件中有否重复行,逐行读文件检测另一文件中是否存在所读内容

我就废话不多说了,还是直接看代码吧!

#!/bin/env python
# coding:utf-8
#程序功能是为了完成判断文件中是否有重复句子
#并将重复句子打印出来

res_list = []
f = open('./downloadmd5.txt','r')
res_dup = []
index = 0
file_dul = open('./r_d.txt', 'w')
file_last = open('./r_nd.txt','w')
for line in f.readlines():
  index = index + 1
  if line in res_list:
    temp_str = ""
    #temp_str = temp_str + str(index) + ','  #要变为str才行
    temp_line = ''.join(line)
    temp_str = temp_str+temp_line
    #最终要变为str类型
    file_dul.write(temp_str);         #将重复的存入到文件中
  else:
    res_list.append(line)
    file_last.write(line)
#!/bin/env python
# coding:utf-8
import re

res_list = []
f = open('./md5.txt','r')
f2 = open('./virus.conf','r')

index = 0
#没重复的文件名
file_dul = open('./m_nd.txt', 'w')
#重复的文件名
file_ex = open('./m_d.txt', 'w')

virstr = f2.read();
for line in f.readlines():
  line=line.strip('\n')
  if(re.search(line, virstr)):
    line = line + '\n'
    file_ex.write(line);
    #调用删除rm -rf filename
  else:
    line = line+'\n'
    file_dul.write(line);

以上这篇python 判断txt每行内容中是否包含子串并重新写入保存的实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python多线程同步Lock、RLock、Semaphore、Event实例
Nov 21 Python
python获取图片颜色信息的方法
Mar 18 Python
Python字符串格式化
Jun 15 Python
python交互式图形编程实例(三)
Nov 17 Python
python生成多个只含0,1元素的随机数组或列表的实例
Nov 12 Python
对Python正则匹配IP、Url、Mail的方法详解
Dec 25 Python
关于Python3 类方法、静态方法新解
Aug 30 Python
tensorboard 可以显示graph,却不能显示scalar的解决方式
Feb 15 Python
Python request操作步骤及代码实例
Apr 13 Python
python为什么要安装到c盘
Jul 20 Python
Python Process创建进程的2种方法详解
Jan 25 Python
教你如何使用Python实现二叉树结构及三种遍历
Jun 18 Python
python 两个一样的字符串用==结果为false问题的解决
Mar 12 #Python
python不相等的两个字符串的 if 条件判断为True详解
Mar 12 #Python
Python 实现使用空值进行赋值 None
Mar 12 #Python
PyCharm永久激活方式(推荐)
Sep 22 #Python
Pycharm激活码激活两种快速方式(附最新激活码和插件)
Mar 12 #Python
pycharm激活码快速激活及使用步骤
Mar 12 #Python
Python自动化测试笔试面试题精选
Mar 12 #Python
You might like
用户的详细注册和判断
2006/10/09 PHP
php页面缓存ob系列函数介绍
2012/10/18 PHP
ThinkPHP视图查询详解
2014/06/30 PHP
PHP7.0安装笔记整理
2015/08/28 PHP
PHP微信开发之查询微信精选文章
2016/06/23 PHP
PHP第三方登录―QQ登录实现方法
2017/02/06 PHP
PHP日志LOG类定义与用法示例
2018/09/06 PHP
jQuery使用attr()方法同时设置多个属性值用法实例
2015/03/26 Javascript
jQuery解析XML文件同时动态增加js文件的方法
2015/06/01 Javascript
判断JS对象是否拥有某属性的方法推荐
2016/05/12 Javascript
jQuery EasyUI常用数据验证汇总
2016/09/18 Javascript
HTML Table 空白单元格补全的简单实现
2016/10/13 Javascript
Node.js编写CLI的实例详解
2017/05/17 Javascript
vue拖拽组件使用方法详解
2018/12/01 Javascript
JS中的算法与数据结构之栈(Stack)实例详解
2019/08/20 Javascript
Vue.js组件props数据验证实现详解
2019/10/19 Javascript
vue 实现锚点功能操作
2020/08/10 Javascript
jQuery中getJSON跨域原理的深入讲解
2020/09/02 jQuery
Vue项目利用axios请求接口下载excel
2020/11/17 Vue.js
举例讲解Python的Tornado框架实现数据可视化的教程
2015/05/02 Python
Linux下通过python访问MySQL、Oracle、SQL Server数据库的方法
2016/04/23 Python
python爬虫_微信公众号推送信息爬取的实例
2017/10/23 Python
Python3实现发送QQ邮件功能(文本)
2017/12/15 Python
Python中将dataframe转换为字典的实例
2018/04/13 Python
Python/ArcPy遍历指定目录中的MDB文件方法
2018/10/27 Python
Python第三方Window模块文件的几种安装方法
2018/11/22 Python
Windows下Sqlmap环境安装教程详解
2020/08/04 Python
自定义Django_rest_framework_jwt登陆错误返回的解决
2020/10/18 Python
Python通过len函数返回对象长度
2020/10/22 Python
分享CSS3制作卡片式图片的方法
2016/07/08 HTML / CSS
Gap英国官网:Gap UK
2018/07/18 全球购物
法国包包和行李箱销售网站:Bagage24.fr
2020/03/24 全球购物
群众路线党课主持词
2014/04/01 职场文书
2015年初中生自我评价范文
2015/03/03 职场文书
《全神贯注》教学反思
2016/02/22 职场文书
app场景下uniapp的扫码记录
2022/07/23 Java/Android