python 判断txt每行内容中是否包含子串并重新写入保存的实例


Posted in Python onMarch 12, 2020

假设需要批量处理多个txt文件,然后将包含子串的内容写入一个txt文件中,这里假设我的子串为"_9"和“_10”

python 判断txt每行内容中是否包含子串并重新写入保存的实例

下面就是我想要得到的其中两行内容(实际上还有很多行哈哈):

python 判断txt每行内容中是否包含子串并重新写入保存的实例

直接上代码:

#! /usr/bin/python
# -*- coding:UTF-8 -*-
 
import os
import os.path
import string

txt文件所在的路径和需要保存的目标路径(根据自己的实际目录进行更改即可):

Crop-Ocr_txt文件夹内放置了我需要批量处理的所有txt,我在同级目录下新建一个文件夹名为1000_simple_Ocrtxts,这里目标路径随意就好,能方便找到就行

txt_path = 'D:/youxinProjections/trafic-youxin/MobileNet_v1/obtain_qq_json_new/Crop_Ocr_txt/'
des_txt_path = 'D:/youxinProjections/trafic-youxin/MobileNet_v1/obtain_qq_json_new/1000_simple_OCRtxts/'
 
txt_files = os.listdir(txt_path) #txt_files能得到该目录下的所有txt文件的文件名

定义一个函数专门用来取包含子串的内容并写入到新的txt文件中,在后边的主函数中直接调用这个函数就行就行:

def select_simples():
  for txtfile in txt_files:
    if not os.path.isdir(txtfile):
      in_file = open(txt_path + txtfile, 'r')
      out_file = open(des_txt_path + txtfile, 'a') # 此处自动新建一个文件夹和txtfile的文件名相同,'a'为自动换行写入
      lines = in_file.readlines()
      for line in lines:
        str_name = line.split(" ")[0] # 这里获取的是txt文件中每行内容以空格隔开的第一个元素,也就是我自己txt文件中的*.jpg那一块内容
str1 = '_9' # 这就是我要判断的子串
        str2 = '_10' # 这也是子串
 
        #if (string.find(str_name, str1)!=-1) or (string.find(str_name, str2)):
        if (str1 in str_name) or (str2 in str_name): # in 可以判断在str_name中是否包含有两个子串,
          out_file.write(line) # 若包含子串,则将该行内容全部重新写入新的txt文件
          print(str_name)
      out_file.close()

主函数到了!:

if __name__ == '__main__':
select_simples()

晒一下最后的结果:

python 判断txt每行内容中是否包含子串并重新写入保存的实例

完美有没有!!!

补充知识:python判断文件中有否重复行,逐行读文件检测另一文件中是否存在所读内容

我就废话不多说了,还是直接看代码吧!

#!/bin/env python
# coding:utf-8
#程序功能是为了完成判断文件中是否有重复句子
#并将重复句子打印出来

res_list = []
f = open('./downloadmd5.txt','r')
res_dup = []
index = 0
file_dul = open('./r_d.txt', 'w')
file_last = open('./r_nd.txt','w')
for line in f.readlines():
  index = index + 1
  if line in res_list:
    temp_str = ""
    #temp_str = temp_str + str(index) + ','  #要变为str才行
    temp_line = ''.join(line)
    temp_str = temp_str+temp_line
    #最终要变为str类型
    file_dul.write(temp_str);         #将重复的存入到文件中
  else:
    res_list.append(line)
    file_last.write(line)
#!/bin/env python
# coding:utf-8
import re

res_list = []
f = open('./md5.txt','r')
f2 = open('./virus.conf','r')

index = 0
#没重复的文件名
file_dul = open('./m_nd.txt', 'w')
#重复的文件名
file_ex = open('./m_d.txt', 'w')

virstr = f2.read();
for line in f.readlines():
  line=line.strip('\n')
  if(re.search(line, virstr)):
    line = line + '\n'
    file_ex.write(line);
    #调用删除rm -rf filename
  else:
    line = line+'\n'
    file_dul.write(line);

以上这篇python 判断txt每行内容中是否包含子串并重新写入保存的实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python求素数示例分享
Feb 16 Python
PyCharm在win10的64位系统安装实例
Nov 26 Python
matplotlib实现区域颜色填充
Mar 18 Python
Django使用redis缓存服务器的实现代码示例
Apr 28 Python
OpenCV-Python 摄像头实时检测人脸代码实例
Apr 30 Python
Django分页功能的实现代码详解
Jul 29 Python
一篇文章搞定Python操作文件与目录
Aug 13 Python
Python面向对象之Web静态服务器
Sep 03 Python
python实现画循环圆
Nov 23 Python
Jupyter 无法下载文件夹如何实现曲线救国
Apr 22 Python
详解Python生成器和基于生成器的协程
Jun 03 Python
python APScheduler执行定时任务介绍
Apr 19 Python
python 两个一样的字符串用==结果为false问题的解决
Mar 12 #Python
python不相等的两个字符串的 if 条件判断为True详解
Mar 12 #Python
Python 实现使用空值进行赋值 None
Mar 12 #Python
PyCharm永久激活方式(推荐)
Sep 22 #Python
Pycharm激活码激活两种快速方式(附最新激活码和插件)
Mar 12 #Python
pycharm激活码快速激活及使用步骤
Mar 12 #Python
Python自动化测试笔试面试题精选
Mar 12 #Python
You might like
利用PHP脚本在Linux下用md5函数加密字符串的方法
2015/06/29 PHP
php实现的任意进制互转类分享
2015/07/07 PHP
php的instanceof和判断闭包Closure操作示例
2020/01/26 PHP
javascript 极速 隐藏/显示万行表格列只需 60毫秒
2009/03/28 Javascript
全面解析Bootstrap表单使用方法(表单控件状态)
2015/11/24 Javascript
基于js中的原型、继承的一些想法
2016/08/10 Javascript
让编辑器支持word复制黏贴、截屏的js代码
2016/10/17 Javascript
js仿新浪微博消息发布功能
2017/02/17 Javascript
canvas实现环形进度条效果
2017/03/23 Javascript
Angularjs使用过滤器完成排序功能
2017/09/20 Javascript
微信小程序中button组件的边框设置的实例详解
2017/09/27 Javascript
JavaScript框架Angular和React深度对比
2017/11/20 Javascript
vue-cli脚手架引入图片的几种方法总结
2018/03/13 Javascript
nodejs中函数的调用实例详解
2018/10/31 NodeJs
详解Ant Design of React的安装和使用方法
2018/12/27 Javascript
python的keyword模块用法实例分析
2015/06/30 Python
Python如何实现守护进程的方法示例
2017/02/08 Python
详解Golang 与python中的字符串反转
2017/07/21 Python
django站点管理详解
2017/12/12 Python
python爬虫中get和post方法介绍以及cookie作用
2018/02/08 Python
python实现隐马尔科夫模型HMM
2018/03/25 Python
Python if语句知识点用法总结
2018/06/10 Python
Python获取网段内ping通IP的方法
2019/01/31 Python
利用pyecharts读取csv并进行数据统计可视化的实现
2020/04/17 Python
基于Python爬取京东双十一商品价格曲线
2020/10/23 Python
CSS3 选择器 基本选择器介绍
2012/01/21 HTML / CSS
焊接专业毕业生求职信
2013/10/01 职场文书
优秀教师工作感言
2014/02/16 职场文书
我的长生果教学反思
2014/04/28 职场文书
班主任工作经验交流材料
2014/05/13 职场文书
科技工作者先进事迹
2014/08/16 职场文书
党员“四风”方面存在问题及整改措施
2014/09/24 职场文书
财政局党的群众路线教育实践活动剖析材料
2014/10/13 职场文书
毕业论文答辩演讲稿
2015/06/23 职场文书
500字作文之难忘的同学
2019/12/20 职场文书
Python获取字典中某个key的value
2022/04/13 Python