使用Python提取文本中含有特定字符串的方法示例


Posted in Python onDecember 09, 2020

今天搞了一天的文本处理,发现python真的太适合做数据处理了。废话不多说,一起学习吧!

1.我的原始数据是这样的,如图

使用Python提取文本中含有特定字符串的方法示例

2.如果要提取每行含有pass的字符串,代码如下:

import re

filepath = "E:/untitled1/analyze_log/test.log"
txt = open(filepath, "r").read()

result=""
test_text = re.findall("..............+pass", txt)#取出每行含有pass的文本
result = result +'\n'.join(test_text)#换行输出
print(result)

3.执行上面代码,可以取出每行含有pass的文本,如图:

使用Python提取文本中含有特定字符串的方法示例

4.其实我真正要提取的是每行类似上图红色框内的字符串,代码实现如下:

import re

filepath = "E:/untitled1/analyze_log/test.log"
txt = open(filepath, "r").read()

result=""
test_text = re.findall("..............+pass", txt)#取出每行含有pass的文本
result = result +'\n'.join(test_text)#换行输出
del_num = re.sub("\d+ ", "", result)#去掉每行行首的数字
del_awake = del_num.replace("awake", "")#去掉awake
del_commd = del_awake.replace("commd", "")#去掉commd
del_string1 = re.sub("-a+\d\d\d\d-\d.wav", "", del_commd)#去掉-a0023-1.wav类型的字符串
del_string2 = re.sub("-a+\d\d\d\d.wav", "", del_string1)#去掉-a0016.wav类型的字符串
print(del_string2)

5.执行上面代码,可以取出最后我需要的文本,如图:

使用Python提取文本中含有特定字符串的方法示例

6.拓展

使用Python提取文本中含有特定字符串的方法示例

7.示例代码

import re

str = 'Hello123/World 45_?6bye'
result1 = re.findall('\d',str)#\d匹配任何十进制数
result2 = re.findall('\d+',str)#\d+可匹配一位或多位数字使用
result3 = re.findall('\D',str)#\d匹配非数字字符任何十进制数
result4 = re.findall('\w',str)#\w匹配任何字母数字字符,包括下划线在内
result5 = re.findall('\W',str)#\W匹配非任何字母数字字符,包括下划线在内
result6 = re.findall('\s',str)#\s匹配任何空白字符
result7 = re.findall('\S',str)#\S匹配非任何空白字符
result8 = re.findall('\AHello',str)#\A仅匹配字符串开头
result9 = re.findall('bye\Z',str)#\Z仅匹配字符串结尾
print(result1)
print(result2)
print(result3)
print(result4)
print(result5)
print(result6)
print(result7)
print(result8)
print(result9)

接下来会更几篇关于文本处理的博客,一边学习一边记笔记。加油!

到此这篇关于使用Python提取文本中含有特定字符串的文章就介绍到这了,更多相关Python提取文本特定字符串内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
Python threading多线程编程实例
Sep 18 Python
Python中模拟enum枚举类型的5种方法分享
Nov 22 Python
Python获取SQLite查询结果表列名的方法
Jun 21 Python
Python高级用法总结
May 26 Python
如何在python中写hive脚本
Nov 08 Python
PyTorch中的Variable变量详解
Jan 07 Python
python爬虫库scrapy简单使用实例详解
Feb 10 Python
Jupyter加载文件的实现方法
Apr 14 Python
Pycharm中安装wordcloud等库失败问题及终端通过pip安装的Python库如何添加到Pycharm解释器中(推荐)
May 10 Python
python的json包位置及用法总结
Jun 21 Python
什么是python的自省
Jun 21 Python
python安装及变量名介绍详解
Dec 12 Python
python使用正则表达式匹配txt特定字符串(有换行)
Dec 09 #Python
PyTorch中clone()、detach()及相关扩展详解
Dec 09 #Python
python调用jenkinsAPI构建jenkins,并传递参数的示例
Dec 09 #Python
python excel多行合并的方法
Dec 09 #Python
PyTorch中的拷贝与就地操作详解
Dec 09 #Python
python 调用Google翻译接口的方法
Dec 09 #Python
浅析Python 中的 WSGI 接口和 WSGI 服务的运行
Dec 09 #Python
You might like
php定界符
2014/06/19 PHP
Thinkphp中volist标签mod控制一定记录的换行BUG解决方法
2014/11/04 PHP
简单的JS多重继承示例
2008/03/13 Javascript
javascript的内存管理详解
2013/08/07 Javascript
html的DOM中document对象forms集合用法实例
2015/01/21 Javascript
JS+CSS实现另类带提示效果的竖向导航菜单
2015/10/15 Javascript
Node.js的Express框架使用上手指南
2016/03/12 Javascript
Angular Module声明和获取重载实例代码
2016/09/14 Javascript
利用Angular.js限制textarea输入的字数
2016/10/20 Javascript
jquery 标签 隔若干行加空白或者加虚线的方法
2016/12/07 Javascript
微信小程序 支付后台java实现实例
2017/05/09 Javascript
AngularJS路由Ui-router模块用法示例
2017/05/29 Javascript
Angular如何引入第三方库的方法详解
2017/07/13 Javascript
JS HTML图片显示Canvas 压缩功能
2017/07/21 Javascript
Angular实现可删除并计算总金额的购物车功能示例
2017/12/26 Javascript
vue使用iframe嵌入网页的示例代码
2020/06/09 Javascript
ES5和ES6中类的区别总结
2020/12/21 Javascript
python快速排序代码实例
2013/11/21 Python
python异常和文件处理机制详解
2016/07/19 Python
Python3操作SQL Server数据库(实例讲解)
2017/10/21 Python
利用python爬取斗鱼app中照片方法实例
2017/12/03 Python
Python SqlAlchemy动态添加数据表字段实例解析
2018/02/07 Python
python 爬虫 批量获取代理ip的实例代码
2018/05/22 Python
Python http接口自动化测试框架实现方法示例
2018/12/06 Python
详解python中eval函数的作用
2019/10/22 Python
python Manager 之dict KeyError问题的解决
2019/12/21 Python
Django项目uwsgi+Nginx保姆级部署教程实现
2020/04/19 Python
python如何代码集体右移
2020/07/20 Python
日期和时间问题
2015/01/04 面试题
应用电子技术专业个人求职信
2013/09/21 职场文书
建材业务员岗位职责
2013/12/08 职场文书
五年级下册复习计划
2015/01/19 职场文书
2015年电厂工作总结范文
2015/05/13 职场文书
焦点访谈观后感
2015/06/11 职场文书
Golang日志包的使用
2022/04/20 Golang
SQLyog的下载、安装、破解、配置教程(MySQL可视化工具安装)
2022/09/23 MySQL