python 判断txt每行内容中是否包含子串并重新写入保存的实例


Posted in Python onMarch 12, 2020

假设需要批量处理多个txt文件,然后将包含子串的内容写入一个txt文件中,这里假设我的子串为"_9"和“_10”

python 判断txt每行内容中是否包含子串并重新写入保存的实例

下面就是我想要得到的其中两行内容(实际上还有很多行哈哈):

python 判断txt每行内容中是否包含子串并重新写入保存的实例

直接上代码:

#! /usr/bin/python
# -*- coding:UTF-8 -*-
 
import os
import os.path
import string

txt文件所在的路径和需要保存的目标路径(根据自己的实际目录进行更改即可):

Crop-Ocr_txt文件夹内放置了我需要批量处理的所有txt,我在同级目录下新建一个文件夹名为1000_simple_Ocrtxts,这里目标路径随意就好,能方便找到就行

txt_path = 'D:/youxinProjections/trafic-youxin/MobileNet_v1/obtain_qq_json_new/Crop_Ocr_txt/'
des_txt_path = 'D:/youxinProjections/trafic-youxin/MobileNet_v1/obtain_qq_json_new/1000_simple_OCRtxts/'
 
txt_files = os.listdir(txt_path) #txt_files能得到该目录下的所有txt文件的文件名

定义一个函数专门用来取包含子串的内容并写入到新的txt文件中,在后边的主函数中直接调用这个函数就行就行:

def select_simples():
  for txtfile in txt_files:
    if not os.path.isdir(txtfile):
      in_file = open(txt_path + txtfile, 'r')
      out_file = open(des_txt_path + txtfile, 'a') # 此处自动新建一个文件夹和txtfile的文件名相同,'a'为自动换行写入
      lines = in_file.readlines()
      for line in lines:
        str_name = line.split(" ")[0] # 这里获取的是txt文件中每行内容以空格隔开的第一个元素,也就是我自己txt文件中的*.jpg那一块内容
str1 = '_9' # 这就是我要判断的子串
        str2 = '_10' # 这也是子串
 
        #if (string.find(str_name, str1)!=-1) or (string.find(str_name, str2)):
        if (str1 in str_name) or (str2 in str_name): # in 可以判断在str_name中是否包含有两个子串,
          out_file.write(line) # 若包含子串,则将该行内容全部重新写入新的txt文件
          print(str_name)
      out_file.close()

主函数到了!:

if __name__ == '__main__':
select_simples()

晒一下最后的结果:

python 判断txt每行内容中是否包含子串并重新写入保存的实例

完美有没有!!!

补充知识:python判断文件中有否重复行,逐行读文件检测另一文件中是否存在所读内容

我就废话不多说了,还是直接看代码吧!

#!/bin/env python
# coding:utf-8
#程序功能是为了完成判断文件中是否有重复句子
#并将重复句子打印出来

res_list = []
f = open('./downloadmd5.txt','r')
res_dup = []
index = 0
file_dul = open('./r_d.txt', 'w')
file_last = open('./r_nd.txt','w')
for line in f.readlines():
  index = index + 1
  if line in res_list:
    temp_str = ""
    #temp_str = temp_str + str(index) + ','  #要变为str才行
    temp_line = ''.join(line)
    temp_str = temp_str+temp_line
    #最终要变为str类型
    file_dul.write(temp_str);         #将重复的存入到文件中
  else:
    res_list.append(line)
    file_last.write(line)
#!/bin/env python
# coding:utf-8
import re

res_list = []
f = open('./md5.txt','r')
f2 = open('./virus.conf','r')

index = 0
#没重复的文件名
file_dul = open('./m_nd.txt', 'w')
#重复的文件名
file_ex = open('./m_d.txt', 'w')

virstr = f2.read();
for line in f.readlines():
  line=line.strip('\n')
  if(re.search(line, virstr)):
    line = line + '\n'
    file_ex.write(line);
    #调用删除rm -rf filename
  else:
    line = line+'\n'
    file_dul.write(line);

以上这篇python 判断txt每行内容中是否包含子串并重新写入保存的实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
pymongo给mongodb创建索引的简单实现方法
May 06 Python
使用Python操作MySQL的一些基本方法
Aug 16 Python
Python中import导入上一级目录模块及循环import问题的解决
Jun 04 Python
Python实现句子翻译功能
Nov 14 Python
numpy数组拼接简单示例
Dec 15 Python
python验证码识别教程之灰度处理、二值化、降噪与tesserocr识别
Jun 04 Python
解决python中画图时x,y轴名称出现中文乱码的问题
Jan 29 Python
python买卖股票的最佳时机(基于贪心/蛮力算法)
Jul 05 Python
python图片指定区域替换img.paste函数的使用
Apr 09 Python
Python代码中如何读取键盘录入的值
May 27 Python
python openCV实现摄像头获取人脸图片
Aug 20 Python
python logging模块的使用详解
Oct 23 Python
python 两个一样的字符串用==结果为false问题的解决
Mar 12 #Python
python不相等的两个字符串的 if 条件判断为True详解
Mar 12 #Python
Python 实现使用空值进行赋值 None
Mar 12 #Python
PyCharm永久激活方式(推荐)
Sep 22 #Python
Pycharm激活码激活两种快速方式(附最新激活码和插件)
Mar 12 #Python
pycharm激活码快速激活及使用步骤
Mar 12 #Python
Python自动化测试笔试面试题精选
Mar 12 #Python
You might like
PHP+DBM的同学录程序(3)
2006/10/09 PHP
PHP setcookie() cannot modify header information 的解决方法
2009/01/09 PHP
php中smarty区域循环的方法
2015/06/11 PHP
JSQL  一个 web DB 的封装
2010/05/05 Javascript
仿猪八戒网左下角的文字滚动效果
2011/10/28 Javascript
JS关键字变色实现思路及代码
2013/02/21 Javascript
悬浮数字的实现案例
2014/02/19 Javascript
基于豆瓣API+Angular开发的web App
2015/01/02 Javascript
jQuery实现菜单式图片滑动切换
2015/03/14 Javascript
JavaScript希尔排序、快速排序、归并排序算法
2016/05/08 Javascript
js只执行1次的函数示例
2016/07/20 Javascript
javascript中的深复制详解及实例分析
2016/12/29 Javascript
微信小程序 中wx.chooseAddress(OBJECT)实例详解
2017/03/31 Javascript
vue组件如何被其他项目引用
2017/04/13 Javascript
AngularJS实现图片上传和预览功能的方法分析
2017/11/08 Javascript
微信小程序定义和调用全局变量globalData的实现
2019/11/01 Javascript
[02:54]DOTA2英雄基础教程 撼地者
2014/01/14 DOTA
python3安装pip3(install pip3 for python 3.x)
2018/04/03 Python
Django项目之Elasticsearch搜索引擎的实例
2019/08/21 Python
sklearn-SVC实现与类参数详解
2019/12/10 Python
Python 窗体(tkinter)下拉列表框(Combobox)实例
2020/03/04 Python
浅谈keras 模型用于预测时的注意事项
2020/06/27 Python
pytorch加载语音类自定义数据集的方法教程
2020/11/10 Python
Python Socket多线程并发原理及实现
2020/12/11 Python
蔻驰美国官网:COACH美国
2016/08/18 全球购物
享受加州生活方式的时尚舒适:XCVI
2018/07/09 全球购物
Mansur Gavriel官网:纽约市的一个设计品牌
2019/05/02 全球购物
机械专业个人求职自荐信格式
2013/09/21 职场文书
成教毕业生自我鉴定
2013/10/23 职场文书
领导干部“四风”查摆问题个人整改措施
2014/10/28 职场文书
音乐教师个人总结
2015/02/06 职场文书
幼儿园推普周活动总结
2015/05/07 职场文书
2016年法制宣传月活动总结
2016/04/01 职场文书
咖啡厅里的创业计划书
2019/08/21 职场文书
Python 如何将integer转化为罗马数(3999以内)
2021/06/05 Python
使用 CSS 轻松实现一些高频出现的奇形怪状按钮
2021/12/06 HTML / CSS