python 判断txt每行内容中是否包含子串并重新写入保存的实例


Posted in Python onMarch 12, 2020

假设需要批量处理多个txt文件,然后将包含子串的内容写入一个txt文件中,这里假设我的子串为"_9"和“_10”

python 判断txt每行内容中是否包含子串并重新写入保存的实例

下面就是我想要得到的其中两行内容(实际上还有很多行哈哈):

python 判断txt每行内容中是否包含子串并重新写入保存的实例

直接上代码:

#! /usr/bin/python
# -*- coding:UTF-8 -*-
 
import os
import os.path
import string

txt文件所在的路径和需要保存的目标路径(根据自己的实际目录进行更改即可):

Crop-Ocr_txt文件夹内放置了我需要批量处理的所有txt,我在同级目录下新建一个文件夹名为1000_simple_Ocrtxts,这里目标路径随意就好,能方便找到就行

txt_path = 'D:/youxinProjections/trafic-youxin/MobileNet_v1/obtain_qq_json_new/Crop_Ocr_txt/'
des_txt_path = 'D:/youxinProjections/trafic-youxin/MobileNet_v1/obtain_qq_json_new/1000_simple_OCRtxts/'
 
txt_files = os.listdir(txt_path) #txt_files能得到该目录下的所有txt文件的文件名

定义一个函数专门用来取包含子串的内容并写入到新的txt文件中,在后边的主函数中直接调用这个函数就行就行:

def select_simples():
  for txtfile in txt_files:
    if not os.path.isdir(txtfile):
      in_file = open(txt_path + txtfile, 'r')
      out_file = open(des_txt_path + txtfile, 'a') # 此处自动新建一个文件夹和txtfile的文件名相同,'a'为自动换行写入
      lines = in_file.readlines()
      for line in lines:
        str_name = line.split(" ")[0] # 这里获取的是txt文件中每行内容以空格隔开的第一个元素,也就是我自己txt文件中的*.jpg那一块内容
str1 = '_9' # 这就是我要判断的子串
        str2 = '_10' # 这也是子串
 
        #if (string.find(str_name, str1)!=-1) or (string.find(str_name, str2)):
        if (str1 in str_name) or (str2 in str_name): # in 可以判断在str_name中是否包含有两个子串,
          out_file.write(line) # 若包含子串,则将该行内容全部重新写入新的txt文件
          print(str_name)
      out_file.close()

主函数到了!:

if __name__ == '__main__':
select_simples()

晒一下最后的结果:

python 判断txt每行内容中是否包含子串并重新写入保存的实例

完美有没有!!!

补充知识:python判断文件中有否重复行,逐行读文件检测另一文件中是否存在所读内容

我就废话不多说了,还是直接看代码吧!

#!/bin/env python
# coding:utf-8
#程序功能是为了完成判断文件中是否有重复句子
#并将重复句子打印出来

res_list = []
f = open('./downloadmd5.txt','r')
res_dup = []
index = 0
file_dul = open('./r_d.txt', 'w')
file_last = open('./r_nd.txt','w')
for line in f.readlines():
  index = index + 1
  if line in res_list:
    temp_str = ""
    #temp_str = temp_str + str(index) + ','  #要变为str才行
    temp_line = ''.join(line)
    temp_str = temp_str+temp_line
    #最终要变为str类型
    file_dul.write(temp_str);         #将重复的存入到文件中
  else:
    res_list.append(line)
    file_last.write(line)
#!/bin/env python
# coding:utf-8
import re

res_list = []
f = open('./md5.txt','r')
f2 = open('./virus.conf','r')

index = 0
#没重复的文件名
file_dul = open('./m_nd.txt', 'w')
#重复的文件名
file_ex = open('./m_d.txt', 'w')

virstr = f2.read();
for line in f.readlines():
  line=line.strip('\n')
  if(re.search(line, virstr)):
    line = line + '\n'
    file_ex.write(line);
    #调用删除rm -rf filename
  else:
    line = line+'\n'
    file_dul.write(line);

以上这篇python 判断txt每行内容中是否包含子串并重新写入保存的实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python中的exec、eval使用实例
Sep 23 Python
Mac下Supervisor进程监控管理工具的安装与配置
Dec 16 Python
在Python的web框架中配置app的教程
Apr 30 Python
全面了解python中的类,对象,方法,属性
Sep 11 Python
python opencv之SIFT算法示例
Feb 24 Python
python贪吃蛇游戏代码
Apr 18 Python
Python实现基于socket的udp传输与接收功能详解
Nov 15 Python
tensorflow从ckpt和从.pb文件读取变量的值方式
May 26 Python
python不到50行代码完成了多张excel合并的实现示例
May 28 Python
Python通过yagmail实现发送邮件代码解析
Oct 27 Python
如何基于Python爬虫爬取美团酒店信息
Nov 03 Python
pytorch 中forward 的用法与解释说明
Feb 26 Python
python 两个一样的字符串用==结果为false问题的解决
Mar 12 #Python
python不相等的两个字符串的 if 条件判断为True详解
Mar 12 #Python
Python 实现使用空值进行赋值 None
Mar 12 #Python
PyCharm永久激活方式(推荐)
Sep 22 #Python
Pycharm激活码激活两种快速方式(附最新激活码和插件)
Mar 12 #Python
pycharm激活码快速激活及使用步骤
Mar 12 #Python
Python自动化测试笔试面试题精选
Mar 12 #Python
You might like
PHP代码网站如何防范SQL注入漏洞攻击建议分享
2012/03/01 PHP
IIS+fastcgi下PHP运行超时问题的解决办法详解
2013/06/20 PHP
PHP生成不重复随机数的方法汇总
2014/11/19 PHP
php中array_unshift()修改数组key注意事项分析
2016/05/16 PHP
PHP读书笔记_运算符详解
2016/07/01 PHP
解决laravel session失效的问题
2019/10/14 PHP
扩展javascript的Date方法实现代码(prototype)
2010/11/20 Javascript
基于jquery的3d效果实现代码
2011/03/23 Javascript
JqGrid web打印实现代码
2011/05/31 Javascript
7个让JavaScript变得更好的注意事项
2015/01/28 Javascript
使用JavaScript实现ajax的实例代码
2016/05/11 Javascript
数据结构中的各种排序方法小结(JS实现)
2016/07/23 Javascript
JavaScript的字符串方法汇总
2016/07/31 Javascript
Web安全测试之XSS实例讲解
2016/08/15 Javascript
详解angular中的作用域及继承
2017/05/31 Javascript
JS解决position:sticky的兼容性问题的方法
2017/10/17 Javascript
Vue cli+mui 区域滚动的实例代码
2018/01/25 Javascript
vue-cli2.9.3 详细教程
2018/04/23 Javascript
JavaScript继承定义与用法实践分析
2018/05/28 Javascript
jQuery实现带3D切割效果的轮播图功能示例【附源码下载】
2019/04/04 jQuery
vue项目中实现缓存的最佳方案详解
2019/07/11 Javascript
使用JavaScript通过前端发送电子邮件
2020/05/22 Javascript
python实现基于SVM手写数字识别功能
2020/05/27 Python
Windows下安装Django框架的方法简明教程
2018/03/28 Python
django进阶之cookie和session的使用示例
2018/08/17 Python
python 实现语音聊天机器人的示例代码
2018/12/02 Python
Python函数装饰器实现方法详解
2018/12/22 Python
利用纯css3实现的文字亮光特效的代码演示
2014/11/27 HTML / CSS
名人珠宝设计师:Melinda Maria Jewelry
2019/03/06 全球购物
主管职责范文
2013/11/09 职场文书
大学生创业计划书
2014/08/14 职场文书
钓鱼岛事件感想
2015/08/11 职场文书
三八红旗手主要事迹材料
2015/11/04 职场文书
职场干货:简历中的自我评价应该这样写!
2019/05/06 职场文书
2019年中,最受大众欢迎的6本新书
2019/08/07 职场文书
Java 多态分析
2022/04/26 Java/Android