python 判断txt每行内容中是否包含子串并重新写入保存的实例


Posted in Python onMarch 12, 2020

假设需要批量处理多个txt文件,然后将包含子串的内容写入一个txt文件中,这里假设我的子串为"_9"和“_10”

python 判断txt每行内容中是否包含子串并重新写入保存的实例

下面就是我想要得到的其中两行内容(实际上还有很多行哈哈):

python 判断txt每行内容中是否包含子串并重新写入保存的实例

直接上代码:

#! /usr/bin/python
# -*- coding:UTF-8 -*-
 
import os
import os.path
import string

txt文件所在的路径和需要保存的目标路径(根据自己的实际目录进行更改即可):

Crop-Ocr_txt文件夹内放置了我需要批量处理的所有txt,我在同级目录下新建一个文件夹名为1000_simple_Ocrtxts,这里目标路径随意就好,能方便找到就行

txt_path = 'D:/youxinProjections/trafic-youxin/MobileNet_v1/obtain_qq_json_new/Crop_Ocr_txt/'
des_txt_path = 'D:/youxinProjections/trafic-youxin/MobileNet_v1/obtain_qq_json_new/1000_simple_OCRtxts/'
 
txt_files = os.listdir(txt_path) #txt_files能得到该目录下的所有txt文件的文件名

定义一个函数专门用来取包含子串的内容并写入到新的txt文件中,在后边的主函数中直接调用这个函数就行就行:

def select_simples():
  for txtfile in txt_files:
    if not os.path.isdir(txtfile):
      in_file = open(txt_path + txtfile, 'r')
      out_file = open(des_txt_path + txtfile, 'a') # 此处自动新建一个文件夹和txtfile的文件名相同,'a'为自动换行写入
      lines = in_file.readlines()
      for line in lines:
        str_name = line.split(" ")[0] # 这里获取的是txt文件中每行内容以空格隔开的第一个元素,也就是我自己txt文件中的*.jpg那一块内容
str1 = '_9' # 这就是我要判断的子串
        str2 = '_10' # 这也是子串
 
        #if (string.find(str_name, str1)!=-1) or (string.find(str_name, str2)):
        if (str1 in str_name) or (str2 in str_name): # in 可以判断在str_name中是否包含有两个子串,
          out_file.write(line) # 若包含子串,则将该行内容全部重新写入新的txt文件
          print(str_name)
      out_file.close()

主函数到了!:

if __name__ == '__main__':
select_simples()

晒一下最后的结果:

python 判断txt每行内容中是否包含子串并重新写入保存的实例

完美有没有!!!

补充知识:python判断文件中有否重复行,逐行读文件检测另一文件中是否存在所读内容

我就废话不多说了,还是直接看代码吧!

#!/bin/env python
# coding:utf-8
#程序功能是为了完成判断文件中是否有重复句子
#并将重复句子打印出来

res_list = []
f = open('./downloadmd5.txt','r')
res_dup = []
index = 0
file_dul = open('./r_d.txt', 'w')
file_last = open('./r_nd.txt','w')
for line in f.readlines():
  index = index + 1
  if line in res_list:
    temp_str = ""
    #temp_str = temp_str + str(index) + ','  #要变为str才行
    temp_line = ''.join(line)
    temp_str = temp_str+temp_line
    #最终要变为str类型
    file_dul.write(temp_str);         #将重复的存入到文件中
  else:
    res_list.append(line)
    file_last.write(line)
#!/bin/env python
# coding:utf-8
import re

res_list = []
f = open('./md5.txt','r')
f2 = open('./virus.conf','r')

index = 0
#没重复的文件名
file_dul = open('./m_nd.txt', 'w')
#重复的文件名
file_ex = open('./m_d.txt', 'w')

virstr = f2.read();
for line in f.readlines():
  line=line.strip('\n')
  if(re.search(line, virstr)):
    line = line + '\n'
    file_ex.write(line);
    #调用删除rm -rf filename
  else:
    line = line+'\n'
    file_dul.write(line);

以上这篇python 判断txt每行内容中是否包含子串并重新写入保存的实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
使用python检测手机QQ在线状态的脚本代码
Feb 10 Python
Python函数中*args和**kwargs来传递变长参数的用法
Jan 26 Python
python urllib urlopen()对象方法/代理的补充说明
Jun 29 Python
numpy实现合并多维矩阵、list的扩展方法
May 08 Python
Python运维开发之psutil库的使用详解
Oct 18 Python
Python 中导入csv数据的三种方法
Nov 01 Python
详解python列表生成式和列表生成式器区别
Mar 27 Python
Win10下Python3.7.3安装教程图解
Jul 08 Python
django云端留言板实例详解
Jul 22 Python
Python实现RGB与HSI颜色空间的互换方式
Nov 27 Python
在 Linux/Mac 下为Python函数添加超时时间的方法
Feb 20 Python
通用的Django注册功能模块实现方法
Feb 05 Python
python 两个一样的字符串用==结果为false问题的解决
Mar 12 #Python
python不相等的两个字符串的 if 条件判断为True详解
Mar 12 #Python
Python 实现使用空值进行赋值 None
Mar 12 #Python
PyCharm永久激活方式(推荐)
Sep 22 #Python
Pycharm激活码激活两种快速方式(附最新激活码和插件)
Mar 12 #Python
pycharm激活码快速激活及使用步骤
Mar 12 #Python
Python自动化测试笔试面试题精选
Mar 12 #Python
You might like
星际中一些鲜为人知的详细资料
2020/03/04 星际争霸
基于PHP读取TXT文件向数据库导入海量数据的方法
2013/04/23 PHP
php实现网站文件批量压缩下载功能
2015/10/28 PHP
PHP最常用的正则表达式
2017/02/13 PHP
(function(){})()的用法与优点
2007/03/11 Javascript
jquery 年会抽奖程序
2011/12/22 Javascript
IE8提示Invalid procedure call or argument 异常的解决方法
2012/09/30 Javascript
将光标定位于输入框最右侧实现代码
2012/12/04 Javascript
php读取sqlite数据库入门实例代码
2014/06/25 Javascript
js获取内联样式的方法
2015/01/27 Javascript
Nodejs实现批量下载妹纸图
2015/05/28 NodeJs
微信小程序 页面跳转传递值几种方法详解
2017/01/12 Javascript
JavaScript和jQuery制作光棒效果
2017/02/24 Javascript
vue.js获取数据库数据实例代码
2017/05/26 Javascript
react native与webview通信的示例代码
2017/09/25 Javascript
Vue中使用Sortable的示例代码
2018/04/07 Javascript
微信小程序使用for循环动态渲染页面操作示例
2018/12/25 Javascript
深入理解react 组件类型及使用场景
2019/03/07 Javascript
Angular中使用ng-zorro图标库部分图标不能正常显示问题
2019/04/22 Javascript
vue操作动画的记录animate.css实例代码
2019/04/26 Javascript
微信小程序实现多选框全选与取消全选功能示例
2019/05/14 Javascript
vscode vue 文件模板的配置方法
2019/07/23 Javascript
Vue2.X和Vue3.0数据响应原理变化的区别
2019/11/07 Javascript
详解vite2.0配置学习(typescript版本)
2021/02/25 Javascript
[48:31]DOTA2-DPC中国联赛 正赛 Dynasty vs XG BO3 第一场 2月2日
2021/03/11 DOTA
django使用xlwt导出excel文件实例代码
2018/02/06 Python
pyqt 多窗口之间的相互调用方法
2019/06/19 Python
tensorflow使用CNN分析mnist手写体数字数据集
2020/06/17 Python
python 浮点数四舍五入需要注意的地方
2020/08/18 Python
基于pycharm 项目和项目文件命名规则的介绍
2021/01/15 Python
详解使用HTML5 Canvas创建动态粒子网格动画
2016/12/14 HTML / CSS
Janie and Jack美国官网:GAP旗下的高档童装品牌
2019/09/09 全球购物
移动通信行业实习自我鉴定
2013/09/28 职场文书
公益广告标语
2014/06/19 职场文书
教师暑期培训感言
2014/08/15 职场文书
公司借条范本
2015/05/25 职场文书