使用Python提取文本中含有特定字符串的方法示例


Posted in Python onDecember 09, 2020

今天搞了一天的文本处理,发现python真的太适合做数据处理了。废话不多说,一起学习吧!

1.我的原始数据是这样的,如图

使用Python提取文本中含有特定字符串的方法示例

2.如果要提取每行含有pass的字符串,代码如下:

import re

filepath = "E:/untitled1/analyze_log/test.log"
txt = open(filepath, "r").read()

result=""
test_text = re.findall("..............+pass", txt)#取出每行含有pass的文本
result = result +'\n'.join(test_text)#换行输出
print(result)

3.执行上面代码,可以取出每行含有pass的文本,如图:

使用Python提取文本中含有特定字符串的方法示例

4.其实我真正要提取的是每行类似上图红色框内的字符串,代码实现如下:

import re

filepath = "E:/untitled1/analyze_log/test.log"
txt = open(filepath, "r").read()

result=""
test_text = re.findall("..............+pass", txt)#取出每行含有pass的文本
result = result +'\n'.join(test_text)#换行输出
del_num = re.sub("\d+ ", "", result)#去掉每行行首的数字
del_awake = del_num.replace("awake", "")#去掉awake
del_commd = del_awake.replace("commd", "")#去掉commd
del_string1 = re.sub("-a+\d\d\d\d-\d.wav", "", del_commd)#去掉-a0023-1.wav类型的字符串
del_string2 = re.sub("-a+\d\d\d\d.wav", "", del_string1)#去掉-a0016.wav类型的字符串
print(del_string2)

5.执行上面代码,可以取出最后我需要的文本,如图:

使用Python提取文本中含有特定字符串的方法示例

6.拓展

使用Python提取文本中含有特定字符串的方法示例

7.示例代码

import re

str = 'Hello123/World 45_?6bye'
result1 = re.findall('\d',str)#\d匹配任何十进制数
result2 = re.findall('\d+',str)#\d+可匹配一位或多位数字使用
result3 = re.findall('\D',str)#\d匹配非数字字符任何十进制数
result4 = re.findall('\w',str)#\w匹配任何字母数字字符,包括下划线在内
result5 = re.findall('\W',str)#\W匹配非任何字母数字字符,包括下划线在内
result6 = re.findall('\s',str)#\s匹配任何空白字符
result7 = re.findall('\S',str)#\S匹配非任何空白字符
result8 = re.findall('\AHello',str)#\A仅匹配字符串开头
result9 = re.findall('bye\Z',str)#\Z仅匹配字符串结尾
print(result1)
print(result2)
print(result3)
print(result4)
print(result5)
print(result6)
print(result7)
print(result8)
print(result9)

接下来会更几篇关于文本处理的博客,一边学习一边记笔记。加油!

到此这篇关于使用Python提取文本中含有特定字符串的文章就介绍到这了,更多相关Python提取文本特定字符串内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
深入理解Python中的元类(metaclass)
Feb 14 Python
Python使用Pycrypto库进行RSA加密的方法详解
Jun 06 Python
Pycharm远程调试openstack的方法
Nov 21 Python
简单实现python数独游戏
Mar 30 Python
通过Pandas读取大文件的实例
Jun 07 Python
Python修改文件往指定行插入内容的实例
Jan 30 Python
Python3模拟curl发送post请求操作示例
May 03 Python
Python中字符串String的基本内置函数与过滤字符模块函数的基本用法
May 27 Python
python字符串替换re.sub()方法解析
Sep 18 Python
在vscode中配置python环境过程解析
Sep 28 Python
DataFrame 数据合并实现(merge,join,concat)
Jun 14 Python
python多线程和多进程关系详解
Dec 14 Python
python使用正则表达式匹配txt特定字符串(有换行)
Dec 09 #Python
PyTorch中clone()、detach()及相关扩展详解
Dec 09 #Python
python调用jenkinsAPI构建jenkins,并传递参数的示例
Dec 09 #Python
python excel多行合并的方法
Dec 09 #Python
PyTorch中的拷贝与就地操作详解
Dec 09 #Python
python 调用Google翻译接口的方法
Dec 09 #Python
浅析Python 中的 WSGI 接口和 WSGI 服务的运行
Dec 09 #Python
You might like
PHP制作图型计数器的例子
2006/10/09 PHP
百度地图API应用之获取用户的具体位置
2014/06/10 PHP
PHP网页游戏学习之Xnova(ogame)源码解读(十二)
2014/06/25 PHP
yii2.0实现验证用户名与邮箱功能
2015/12/22 PHP
phpStudy中升级MySQL版本到5.7.17的方法步骤
2017/08/03 PHP
laravel-admin 实现在指定的相册下添加照片
2019/10/21 PHP
JObj预览一个JS的框架
2008/03/13 Javascript
JS+XML 省份和城市之间的联动实现代码
2009/10/14 Javascript
可恶的ie8提示缺少id未定义
2014/03/20 Javascript
jquery新的绑定事件机制on方法的使用方法
2014/04/15 Javascript
原生js结合html5制作简易的双色子游戏
2015/03/30 Javascript
php常见的页面跳转方法汇总
2015/04/15 Javascript
深入浅析同源策略和跨域访问
2015/11/26 Javascript
jQuery插件HighCharts绘制2D金字塔图效果示例【附demo源码下载】
2017/03/09 Javascript
JS中图片压缩的方法小结
2017/11/14 Javascript
微信小程序分享功能之按钮button 边框隐藏和点击隐藏
2018/06/14 Javascript
通过JavaScript下载文件到本地的方法(单文件)
2019/03/17 Javascript
解决Idea、WebStorm下使用Vue cli脚手架项目无法使用Webpack别名的问题
2019/10/11 Javascript
uni-app使用countdown插件实现倒计时
2020/11/01 Javascript
Python中time模块和datetime模块的用法示例
2016/02/28 Python
python3.4用函数操作mysql5.7数据库
2017/06/23 Python
python如何解析配置文件并应用到项目中
2019/06/27 Python
python使用opencv对图像mask处理的方法
2019/07/05 Python
linux中如何使用python3获取ip地址
2019/07/15 Python
Python如何用filter函数筛选数据
2020/03/05 Python
Python实现加密的RAR文件解压的方法(密码已知)
2020/09/11 Python
CSS3实现瀑布流布局与无限加载图片相册的实例代码
2016/12/22 HTML / CSS
html5 viewport使用方法示例详解
2013/12/02 HTML / CSS
10条PHP编程习惯
2014/05/26 面试题
最新茶叶店创业计划书
2014/01/14 职场文书
《最大的麦穗》教学反思
2014/04/17 职场文书
安全演讲稿大全
2014/05/09 职场文书
信用社竞聘演讲稿
2014/05/16 职场文书
慰问信范文
2015/02/14 职场文书
go xorm框架的使用
2021/05/22 Golang
python神经网络学习 使用Keras进行简单分类
2022/05/04 Python