使用Python提取文本中含有特定字符串的方法示例


Posted in Python onDecember 09, 2020

今天搞了一天的文本处理,发现python真的太适合做数据处理了。废话不多说,一起学习吧!

1.我的原始数据是这样的,如图

使用Python提取文本中含有特定字符串的方法示例

2.如果要提取每行含有pass的字符串,代码如下:

import re

filepath = "E:/untitled1/analyze_log/test.log"
txt = open(filepath, "r").read()

result=""
test_text = re.findall("..............+pass", txt)#取出每行含有pass的文本
result = result +'\n'.join(test_text)#换行输出
print(result)

3.执行上面代码,可以取出每行含有pass的文本,如图:

使用Python提取文本中含有特定字符串的方法示例

4.其实我真正要提取的是每行类似上图红色框内的字符串,代码实现如下:

import re

filepath = "E:/untitled1/analyze_log/test.log"
txt = open(filepath, "r").read()

result=""
test_text = re.findall("..............+pass", txt)#取出每行含有pass的文本
result = result +'\n'.join(test_text)#换行输出
del_num = re.sub("\d+ ", "", result)#去掉每行行首的数字
del_awake = del_num.replace("awake", "")#去掉awake
del_commd = del_awake.replace("commd", "")#去掉commd
del_string1 = re.sub("-a+\d\d\d\d-\d.wav", "", del_commd)#去掉-a0023-1.wav类型的字符串
del_string2 = re.sub("-a+\d\d\d\d.wav", "", del_string1)#去掉-a0016.wav类型的字符串
print(del_string2)

5.执行上面代码,可以取出最后我需要的文本,如图:

使用Python提取文本中含有特定字符串的方法示例

6.拓展

使用Python提取文本中含有特定字符串的方法示例

7.示例代码

import re

str = 'Hello123/World 45_?6bye'
result1 = re.findall('\d',str)#\d匹配任何十进制数
result2 = re.findall('\d+',str)#\d+可匹配一位或多位数字使用
result3 = re.findall('\D',str)#\d匹配非数字字符任何十进制数
result4 = re.findall('\w',str)#\w匹配任何字母数字字符,包括下划线在内
result5 = re.findall('\W',str)#\W匹配非任何字母数字字符,包括下划线在内
result6 = re.findall('\s',str)#\s匹配任何空白字符
result7 = re.findall('\S',str)#\S匹配非任何空白字符
result8 = re.findall('\AHello',str)#\A仅匹配字符串开头
result9 = re.findall('bye\Z',str)#\Z仅匹配字符串结尾
print(result1)
print(result2)
print(result3)
print(result4)
print(result5)
print(result6)
print(result7)
print(result8)
print(result9)

接下来会更几篇关于文本处理的博客,一边学习一边记笔记。加油!

到此这篇关于使用Python提取文本中含有特定字符串的文章就介绍到这了,更多相关Python提取文本特定字符串内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
Python实现的简单万年历例子分享
Apr 25 Python
python字符串连接方式汇总
Aug 21 Python
跟老齐学Python之有点简约的元组
Sep 24 Python
python让图片按照exif信息里的创建时间进行排序的方法
Mar 16 Python
提升Python程序运行效率的6个方法
Mar 31 Python
VTK与Python实现机械臂三维模型可视化详解
Dec 13 Python
Python方法的延迟加载的示例代码
Dec 18 Python
Python实现matplotlib显示中文的方法详解
Feb 06 Python
python实现图书馆研习室自动预约功能
Apr 27 Python
树莓派+摄像头实现对移动物体的检测
Jun 22 Python
Python 内置变量和函数的查看及说明介绍
Dec 25 Python
Python+DeOldify实现老照片上色功能
Jun 21 Python
python使用正则表达式匹配txt特定字符串(有换行)
Dec 09 #Python
PyTorch中clone()、detach()及相关扩展详解
Dec 09 #Python
python调用jenkinsAPI构建jenkins,并传递参数的示例
Dec 09 #Python
python excel多行合并的方法
Dec 09 #Python
PyTorch中的拷贝与就地操作详解
Dec 09 #Python
python 调用Google翻译接口的方法
Dec 09 #Python
浅析Python 中的 WSGI 接口和 WSGI 服务的运行
Dec 09 #Python
You might like
php URL验证正则表达式
2011/07/19 PHP
php中使用preg_match_all匹配文章中的图片
2013/02/06 PHP
神盾加密解密教程(二)PHP 神盾解密
2014/06/08 PHP
php去掉文件前几行的方法
2015/07/29 PHP
HTML-CSS群中单选引发的“事件”
2007/03/05 Javascript
jquery(live)中File input的change方法只起一次作用的解决办法
2011/10/21 Javascript
jQuery对象数据缓存Cache原理及jQuery.data方法区别介绍
2013/04/07 Javascript
使用JavaScript实现弹出层效果的简单实例
2016/05/31 Javascript
JS Array创建及concat()split()slice()的使用方法
2016/06/03 Javascript
javascript实现随机生成DIV背景色
2016/06/20 Javascript
vueJs实现DOM加载完之后自动下拉到底部的实例代码
2018/08/31 Javascript
微信小程序实现写入读取缓存详解
2019/08/30 Javascript
vue仿淘宝滑动验证码功能(样式模仿)
2019/12/10 Javascript
Python Tkinter GUI编程入门介绍
2015/03/10 Python
教你用 Python 实现微信跳一跳(Mac+iOS版)
2018/01/04 Python
获取python的list中含有重复值的index方法
2018/06/27 Python
基于Python安装pyecharts所遇的问题及解决方法
2019/08/12 Python
pytorch使用tensorboardX进行loss可视化实例
2020/02/24 Python
Django中如何用xlwt生成表格的方法步骤
2021/01/31 Python
用CSS3将你的设计带入下个高度
2009/08/08 HTML / CSS
深入浅析css3 中display box使用方法
2015/11/25 HTML / CSS
HTML5 Canvas实现平移/放缩/旋转deom示例(附截图)
2013/07/04 HTML / CSS
Lululemon英国官网:加拿大瑜伽服装品牌
2019/01/14 全球购物
写一个方法,输入一个文件名和一个字符串,统计这个字符串在这个文件中出现的次数
2016/04/13 面试题
电子商务个人自荐信
2013/12/12 职场文书
自我反省检讨书
2014/01/23 职场文书
投标邀请书范文
2014/01/31 职场文书
“向国旗敬礼”活动策划方案(4篇)
2014/09/27 职场文书
销售助理岗位职责
2015/02/11 职场文书
八年级地理课件资料及考点知识分享
2019/08/30 职场文书
2019年教师节祝福语精选,给老师送上真诚的祝福
2019/09/09 职场文书
CSS的class与id常用的命名规则
2021/05/18 HTML / CSS
Pandas 稀疏数据结构的实现
2021/07/25 Python
《现实主义勇者的王国再建记》第三弹OST全曲试听片段公开
2022/04/04 日漫
windows server2012 R2下安装PaddleOCR服务的的详细步骤
2022/09/23 Servers
mysql通过group by分组取最大时间对应数据的两种有效方法
2022/09/23 MySQL