python 判断txt每行内容中是否包含子串并重新写入保存的实例


Posted in Python onMarch 12, 2020

假设需要批量处理多个txt文件,然后将包含子串的内容写入一个txt文件中,这里假设我的子串为"_9"和“_10”

python 判断txt每行内容中是否包含子串并重新写入保存的实例

下面就是我想要得到的其中两行内容(实际上还有很多行哈哈):

python 判断txt每行内容中是否包含子串并重新写入保存的实例

直接上代码:

#! /usr/bin/python
# -*- coding:UTF-8 -*-
 
import os
import os.path
import string

txt文件所在的路径和需要保存的目标路径(根据自己的实际目录进行更改即可):

Crop-Ocr_txt文件夹内放置了我需要批量处理的所有txt,我在同级目录下新建一个文件夹名为1000_simple_Ocrtxts,这里目标路径随意就好,能方便找到就行

txt_path = 'D:/youxinProjections/trafic-youxin/MobileNet_v1/obtain_qq_json_new/Crop_Ocr_txt/'
des_txt_path = 'D:/youxinProjections/trafic-youxin/MobileNet_v1/obtain_qq_json_new/1000_simple_OCRtxts/'
 
txt_files = os.listdir(txt_path) #txt_files能得到该目录下的所有txt文件的文件名

定义一个函数专门用来取包含子串的内容并写入到新的txt文件中,在后边的主函数中直接调用这个函数就行就行:

def select_simples():
  for txtfile in txt_files:
    if not os.path.isdir(txtfile):
      in_file = open(txt_path + txtfile, 'r')
      out_file = open(des_txt_path + txtfile, 'a') # 此处自动新建一个文件夹和txtfile的文件名相同,'a'为自动换行写入
      lines = in_file.readlines()
      for line in lines:
        str_name = line.split(" ")[0] # 这里获取的是txt文件中每行内容以空格隔开的第一个元素,也就是我自己txt文件中的*.jpg那一块内容
str1 = '_9' # 这就是我要判断的子串
        str2 = '_10' # 这也是子串
 
        #if (string.find(str_name, str1)!=-1) or (string.find(str_name, str2)):
        if (str1 in str_name) or (str2 in str_name): # in 可以判断在str_name中是否包含有两个子串,
          out_file.write(line) # 若包含子串,则将该行内容全部重新写入新的txt文件
          print(str_name)
      out_file.close()

主函数到了!:

if __name__ == '__main__':
select_simples()

晒一下最后的结果:

python 判断txt每行内容中是否包含子串并重新写入保存的实例

完美有没有!!!

补充知识:python判断文件中有否重复行,逐行读文件检测另一文件中是否存在所读内容

我就废话不多说了,还是直接看代码吧!

#!/bin/env python
# coding:utf-8
#程序功能是为了完成判断文件中是否有重复句子
#并将重复句子打印出来

res_list = []
f = open('./downloadmd5.txt','r')
res_dup = []
index = 0
file_dul = open('./r_d.txt', 'w')
file_last = open('./r_nd.txt','w')
for line in f.readlines():
  index = index + 1
  if line in res_list:
    temp_str = ""
    #temp_str = temp_str + str(index) + ','  #要变为str才行
    temp_line = ''.join(line)
    temp_str = temp_str+temp_line
    #最终要变为str类型
    file_dul.write(temp_str);         #将重复的存入到文件中
  else:
    res_list.append(line)
    file_last.write(line)
#!/bin/env python
# coding:utf-8
import re

res_list = []
f = open('./md5.txt','r')
f2 = open('./virus.conf','r')

index = 0
#没重复的文件名
file_dul = open('./m_nd.txt', 'w')
#重复的文件名
file_ex = open('./m_d.txt', 'w')

virstr = f2.read();
for line in f.readlines():
  line=line.strip('\n')
  if(re.search(line, virstr)):
    line = line + '\n'
    file_ex.write(line);
    #调用删除rm -rf filename
  else:
    line = line+'\n'
    file_dul.write(line);

以上这篇python 判断txt每行内容中是否包含子串并重新写入保存的实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python tkinter事件高级用法实例
Jan 31 Python
Python命令行解析模块详解
Feb 01 Python
儿童学习python的一些小技巧
May 27 Python
python实现超简单的视频对象提取功能
Jun 04 Python
对Python Class之间函数的调用关系详解
Jan 23 Python
python实现顺时针打印矩阵
Mar 02 Python
python实现QQ空间自动点赞功能
Apr 09 Python
selenium2.0中常用的python函数汇总
Aug 05 Python
详解python statistics模块及函数用法
Oct 27 Python
python小程序基于Jupyter实现天气查询的方法
Mar 27 Python
Django ModelForm操作及验证方式
Mar 30 Python
一文搞懂python异常处理、模块与包
Jun 26 Python
python 两个一样的字符串用==结果为false问题的解决
Mar 12 #Python
python不相等的两个字符串的 if 条件判断为True详解
Mar 12 #Python
Python 实现使用空值进行赋值 None
Mar 12 #Python
PyCharm永久激活方式(推荐)
Sep 22 #Python
Pycharm激活码激活两种快速方式(附最新激活码和插件)
Mar 12 #Python
pycharm激活码快速激活及使用步骤
Mar 12 #Python
Python自动化测试笔试面试题精选
Mar 12 #Python
You might like
用PHP来计算某个目录大小的方法
2014/04/01 PHP
万能的php分页类
2017/07/06 PHP
PHP 爬取网页的主要方法
2018/07/13 PHP
js 实现打印网页中定义的部分内容的代码
2010/04/01 Javascript
在js(jquery)中获得文本框焦点和失去焦点的方法
2012/12/04 Javascript
关于jquery input textare 事件绑定及用法学习
2013/04/03 Javascript
深入讲解AngularJS中的自定义指令的使用
2015/06/18 Javascript
js+css实现的圆角边框TAB选项卡滑动门代码分享(2款)
2015/08/26 Javascript
JS实现可自定义大小,可双击关闭的弹出层效果
2015/10/16 Javascript
jQuery插件 Jqplot图表实例
2016/06/18 Javascript
JavaScript数组去重由慢到快由繁到简(优化篇)
2016/08/26 Javascript
Bootstrap Table的使用总结
2016/10/08 Javascript
Bootstrap 3浏览器兼容性问题及解决方案
2017/04/11 Javascript
详解nodejs实现本地上传图片并预览功能(express4.0+)
2017/06/28 NodeJs
详解使用Visual Studio Code对Node.js进行断点调试
2017/09/14 Javascript
express 项目分层实践详解
2018/12/10 Javascript
解决layui中onchange失效以及form动态渲染失效的问题
2019/09/27 Javascript
[48:54]VGJ.T vs infamous Supermajor小组赛D组败者组第一轮 BO3 第二场 6.3
2018/06/04 DOTA
python 输入一个数n,求n个数求乘或求和的实例
2018/11/13 Python
解决项目pycharm能运行,在终端却无法运行的问题
2019/01/19 Python
详解Selenium+PhantomJS+python简单实现爬虫的功能
2019/07/14 Python
python如何实现从视频中提取每秒图片
2020/10/22 Python
使用Django实现把两个模型类的数据聚合在一起
2020/03/28 Python
通过cmd进入python的步骤
2020/06/16 Python
win10安装python3.6的常见问题
2020/07/01 Python
详解移动端Html5页面中1px边框的几种解决方法
2018/07/24 HTML / CSS
小学英语教学反思案例
2014/02/04 职场文书
诚信承诺书范文
2014/03/27 职场文书
小学老师寄语大全
2014/04/04 职场文书
家长对老师的评语
2014/04/18 职场文书
高中升旗仪式演讲稿
2014/09/09 职场文书
群众路线教育实践活动思想汇报(2014特荐篇)
2014/09/16 职场文书
安全守法证明
2015/06/23 职场文书
卫生主题班会
2015/08/14 职场文书
springboot集成flyway自动创表的详细配置
2021/06/26 Java/Android
HTML基本元素标签介绍
2022/02/28 HTML / CSS