使用Python提取文本中含有特定字符串的方法示例


Posted in Python onDecember 09, 2020

今天搞了一天的文本处理,发现python真的太适合做数据处理了。废话不多说,一起学习吧!

1.我的原始数据是这样的,如图

使用Python提取文本中含有特定字符串的方法示例

2.如果要提取每行含有pass的字符串,代码如下:

import re

filepath = "E:/untitled1/analyze_log/test.log"
txt = open(filepath, "r").read()

result=""
test_text = re.findall("..............+pass", txt)#取出每行含有pass的文本
result = result +'\n'.join(test_text)#换行输出
print(result)

3.执行上面代码,可以取出每行含有pass的文本,如图:

使用Python提取文本中含有特定字符串的方法示例

4.其实我真正要提取的是每行类似上图红色框内的字符串,代码实现如下:

import re

filepath = "E:/untitled1/analyze_log/test.log"
txt = open(filepath, "r").read()

result=""
test_text = re.findall("..............+pass", txt)#取出每行含有pass的文本
result = result +'\n'.join(test_text)#换行输出
del_num = re.sub("\d+ ", "", result)#去掉每行行首的数字
del_awake = del_num.replace("awake", "")#去掉awake
del_commd = del_awake.replace("commd", "")#去掉commd
del_string1 = re.sub("-a+\d\d\d\d-\d.wav", "", del_commd)#去掉-a0023-1.wav类型的字符串
del_string2 = re.sub("-a+\d\d\d\d.wav", "", del_string1)#去掉-a0016.wav类型的字符串
print(del_string2)

5.执行上面代码,可以取出最后我需要的文本,如图:

使用Python提取文本中含有特定字符串的方法示例

6.拓展

使用Python提取文本中含有特定字符串的方法示例

7.示例代码

import re

str = 'Hello123/World 45_?6bye'
result1 = re.findall('\d',str)#\d匹配任何十进制数
result2 = re.findall('\d+',str)#\d+可匹配一位或多位数字使用
result3 = re.findall('\D',str)#\d匹配非数字字符任何十进制数
result4 = re.findall('\w',str)#\w匹配任何字母数字字符,包括下划线在内
result5 = re.findall('\W',str)#\W匹配非任何字母数字字符,包括下划线在内
result6 = re.findall('\s',str)#\s匹配任何空白字符
result7 = re.findall('\S',str)#\S匹配非任何空白字符
result8 = re.findall('\AHello',str)#\A仅匹配字符串开头
result9 = re.findall('bye\Z',str)#\Z仅匹配字符串结尾
print(result1)
print(result2)
print(result3)
print(result4)
print(result5)
print(result6)
print(result7)
print(result8)
print(result9)

接下来会更几篇关于文本处理的博客,一边学习一边记笔记。加油!

到此这篇关于使用Python提取文本中含有特定字符串的文章就介绍到这了,更多相关Python提取文本特定字符串内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python中精确输出JSON浮点数的方法
Apr 18 Python
Python实现PS滤镜的万花筒效果示例
Jan 23 Python
Ubuntu下使用Python实现游戏制作中的切分图片功能
Mar 30 Python
在python中,使用scatter绘制散点图的实例
Jul 03 Python
python PyAutoGUI 模拟鼠标键盘操作和截屏功能
Aug 04 Python
python 3.7.4 安装 opencv的教程
Oct 10 Python
详解opencv中画圆circle函数和椭圆ellipse函数
Dec 27 Python
PHP基于phpqrcode类库生成二维码过程解析
May 28 Python
完美解决pycharm 不显示代码提示问题
Jun 02 Python
python 实现"神经衰弱"翻牌游戏
Nov 09 Python
python爬取抖音视频的实例分析
Jan 19 Python
Python日志模块logging用法
Jun 05 Python
python使用正则表达式匹配txt特定字符串(有换行)
Dec 09 #Python
PyTorch中clone()、detach()及相关扩展详解
Dec 09 #Python
python调用jenkinsAPI构建jenkins,并传递参数的示例
Dec 09 #Python
python excel多行合并的方法
Dec 09 #Python
PyTorch中的拷贝与就地操作详解
Dec 09 #Python
python 调用Google翻译接口的方法
Dec 09 #Python
浅析Python 中的 WSGI 接口和 WSGI 服务的运行
Dec 09 #Python
You might like
如何分别全角和半角以避免乱码
2006/10/09 PHP
Yii2使用小技巧之通过 Composer 添加 FontAwesome 字体资源
2014/06/22 PHP
Yii2 rbac权限控制之菜单menu实例教程
2016/04/28 PHP
适合PHP初学者阅读的4本经典书籍
2016/09/23 PHP
Yii2中datetime类的使用
2016/12/17 PHP
PHP将数据导出Excel表中的实例(投机型)
2017/07/31 PHP
js创建对象的方式总结
2015/01/10 Javascript
JS控制层作圆周运动的方法
2016/06/20 Javascript
利用jquery获取select下拉框的值
2016/11/23 Javascript
基于JavaScript实现带缩略图的轮播效果
2017/01/12 Javascript
Javascript基础回顾之(一) 类型
2017/01/31 Javascript
vue.js实现请求数据的方法示例
2017/02/07 Javascript
JS实现的五级联动菜单效果完整实例
2017/02/23 Javascript
jQuery控制元素隐藏和显示
2017/03/03 Javascript
利用JS实现简单的瀑布流加载图片效果
2017/04/22 Javascript
JavaScript 数组去重并统计重复元素出现的次数实例
2017/12/14 Javascript
微信小程序实现无限滚动列表
2020/05/29 Javascript
Vue中多个元素、组件的过渡及列表过渡的方法示例
2019/02/13 Javascript
微信小程序点击保存图片到本机功能
2019/12/13 Javascript
原生JavaScript实现的无缝滚动功能详解
2020/01/17 Javascript
十分钟教你上手ES2020新特性
2020/02/12 Javascript
python模块之re正则表达式详解
2017/02/03 Python
Python numpy 点数组去重的实例
2018/04/18 Python
python 爬虫 批量获取代理ip的实例代码
2018/05/22 Python
NumPy.npy与pandas DataFrame的实例讲解
2018/07/09 Python
提升Python程序性能的7个习惯
2019/04/14 Python
深入浅析python3中的unicode和bytes问题
2019/07/03 Python
python实现发送form-data数据的方法详解
2019/09/27 Python
使用python实现多维数据降维操作
2020/02/24 Python
使用CSS3制作响应式导航菜单的方法
2015/07/12 HTML / CSS
巴黎一票通:The Paris Pass
2018/02/10 全球购物
旷课检讨书2000字
2014/01/14 职场文书
关于赌博的检讨书
2014/01/24 职场文书
员工离职感谢信
2015/01/22 职场文书
2015年公司中秋节致辞
2015/07/31 职场文书
python中%格式表达式实例用法
2021/06/18 Python