使用Python提取文本中含有特定字符串的方法示例


Posted in Python onDecember 09, 2020

今天搞了一天的文本处理,发现python真的太适合做数据处理了。废话不多说,一起学习吧!

1.我的原始数据是这样的,如图

使用Python提取文本中含有特定字符串的方法示例

2.如果要提取每行含有pass的字符串,代码如下:

import re

filepath = "E:/untitled1/analyze_log/test.log"
txt = open(filepath, "r").read()

result=""
test_text = re.findall("..............+pass", txt)#取出每行含有pass的文本
result = result +'\n'.join(test_text)#换行输出
print(result)

3.执行上面代码,可以取出每行含有pass的文本,如图:

使用Python提取文本中含有特定字符串的方法示例

4.其实我真正要提取的是每行类似上图红色框内的字符串,代码实现如下:

import re

filepath = "E:/untitled1/analyze_log/test.log"
txt = open(filepath, "r").read()

result=""
test_text = re.findall("..............+pass", txt)#取出每行含有pass的文本
result = result +'\n'.join(test_text)#换行输出
del_num = re.sub("\d+ ", "", result)#去掉每行行首的数字
del_awake = del_num.replace("awake", "")#去掉awake
del_commd = del_awake.replace("commd", "")#去掉commd
del_string1 = re.sub("-a+\d\d\d\d-\d.wav", "", del_commd)#去掉-a0023-1.wav类型的字符串
del_string2 = re.sub("-a+\d\d\d\d.wav", "", del_string1)#去掉-a0016.wav类型的字符串
print(del_string2)

5.执行上面代码,可以取出最后我需要的文本,如图:

使用Python提取文本中含有特定字符串的方法示例

6.拓展

使用Python提取文本中含有特定字符串的方法示例

7.示例代码

import re

str = 'Hello123/World 45_?6bye'
result1 = re.findall('\d',str)#\d匹配任何十进制数
result2 = re.findall('\d+',str)#\d+可匹配一位或多位数字使用
result3 = re.findall('\D',str)#\d匹配非数字字符任何十进制数
result4 = re.findall('\w',str)#\w匹配任何字母数字字符,包括下划线在内
result5 = re.findall('\W',str)#\W匹配非任何字母数字字符,包括下划线在内
result6 = re.findall('\s',str)#\s匹配任何空白字符
result7 = re.findall('\S',str)#\S匹配非任何空白字符
result8 = re.findall('\AHello',str)#\A仅匹配字符串开头
result9 = re.findall('bye\Z',str)#\Z仅匹配字符串结尾
print(result1)
print(result2)
print(result3)
print(result4)
print(result5)
print(result6)
print(result7)
print(result8)
print(result9)

接下来会更几篇关于文本处理的博客,一边学习一边记笔记。加油!

到此这篇关于使用Python提取文本中含有特定字符串的文章就介绍到这了,更多相关Python提取文本特定字符串内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
对Python进行数据分析_关于Package的安装问题
May 22 Python
Python实现希尔排序算法的原理与用法实例分析
Nov 23 Python
python list元素为tuple时的排序方法
Apr 18 Python
NLTK 3.2.4 环境搭建教程
Sep 19 Python
PyQt5的PyQtGraph实践系列3之实时数据更新绘制图形
May 13 Python
python+logging+yaml实现日志分割
Jul 22 Python
Python元组 tuple的概念与基本操作详解【定义、创建、访问、计数、推导式等】
Oct 30 Python
Django分组聚合查询实例分享
Apr 29 Python
使用keras根据层名称来初始化网络
May 21 Python
tensorflow 2.1.0 安装与实战教程(CASIA FACE v5)
Jun 30 Python
python 基于PYMYSQL使用MYSQL数据库
Dec 24 Python
python神经网络学习 使用Keras进行简单分类
May 04 Python
python使用正则表达式匹配txt特定字符串(有换行)
Dec 09 #Python
PyTorch中clone()、detach()及相关扩展详解
Dec 09 #Python
python调用jenkinsAPI构建jenkins,并传递参数的示例
Dec 09 #Python
python excel多行合并的方法
Dec 09 #Python
PyTorch中的拷贝与就地操作详解
Dec 09 #Python
python 调用Google翻译接口的方法
Dec 09 #Python
浅析Python 中的 WSGI 接口和 WSGI 服务的运行
Dec 09 #Python
You might like
全国FM电台频率大全 - 20 广西省
2020/03/11 无线电
详解WordPress中提醒安装插件以及隐藏插件的功能实现
2015/12/25 PHP
thinkPHP查询方式小结
2016/01/09 PHP
PHP的Yii框架中使用数据库的配置和SQL操作实例教程
2016/03/17 PHP
php实现微信企业号支付个人的方法详解
2017/07/26 PHP
PHP设计模式之迭代器模式Iterator实例分析【对象行为型】
2020/04/26 PHP
解javascript 混淆加密收藏
2009/01/16 Javascript
jquery select下拉框操作的一些说明
2010/04/02 Javascript
jquery实用代码片段集合
2010/08/12 Javascript
JQuery中关于jquery.js与jquery.min.js的比较探讨
2013/05/15 Javascript
js为数字添加逗号并格式化数字的代码
2013/08/23 Javascript
鼠标移入移出事件改变图片的分辨率的两种方法
2013/12/17 Javascript
js显示当前日期时间和星期几
2015/10/22 Javascript
原生javascript实现的一个简单动画效果
2016/03/30 Javascript
Node.js服务器环境下使用Mock.js拦截AJAX请求的教程
2016/05/23 Javascript
AngularJS基础 ng-show 指令简单示例
2016/08/03 Javascript
JQuery页面随滚动条动态加载效果的简单实现(推荐)
2017/02/08 Javascript
ionic+AngularJs实现获取验证码倒计时按钮
2017/04/22 Javascript
jQuery.form.js的使用详解
2017/06/14 jQuery
swiper插件自定义切换箭头按钮
2017/12/28 Javascript
基于element-ui的rules中正则表达式
2018/09/04 Javascript
Vue 组件封装 并使用 NPM 发布的教程
2018/09/30 Javascript
JavaScript实现Excel表格效果
2020/02/07 Javascript
JS面向对象编程实现的拖拽功能案例详解
2020/03/03 Javascript
分享一款超好用的JavaScript 打包压缩工具
2020/04/26 Javascript
Vue的Options用法说明
2020/08/14 Javascript
js实现详情页放大镜效果
2020/10/28 Javascript
[01:25]DOTA2超级联赛专访iG 将调整状态找回自己
2013/06/05 DOTA
[48:29]2018DOTA2亚洲邀请赛3月30日 小组赛A组 LGD VS KG
2018/03/31 DOTA
python创建文件备份的脚本
2018/09/11 Python
python 装饰器功能与用法案例详解
2020/03/06 Python
Python进程的通信Queue、Pipe实例分析
2020/03/30 Python
大学毕业自我评价
2014/02/02 职场文书
房产买卖委托公证书
2014/04/04 职场文书
诚实守信道德模范事迹材料
2014/08/15 职场文书
2015年小学实验室工作总结
2015/07/28 职场文书