使用Python提取文本中含有特定字符串的方法示例


Posted in Python onDecember 09, 2020

今天搞了一天的文本处理,发现python真的太适合做数据处理了。废话不多说,一起学习吧!

1.我的原始数据是这样的,如图

使用Python提取文本中含有特定字符串的方法示例

2.如果要提取每行含有pass的字符串,代码如下:

import re

filepath = "E:/untitled1/analyze_log/test.log"
txt = open(filepath, "r").read()

result=""
test_text = re.findall("..............+pass", txt)#取出每行含有pass的文本
result = result +'\n'.join(test_text)#换行输出
print(result)

3.执行上面代码,可以取出每行含有pass的文本,如图:

使用Python提取文本中含有特定字符串的方法示例

4.其实我真正要提取的是每行类似上图红色框内的字符串,代码实现如下:

import re

filepath = "E:/untitled1/analyze_log/test.log"
txt = open(filepath, "r").read()

result=""
test_text = re.findall("..............+pass", txt)#取出每行含有pass的文本
result = result +'\n'.join(test_text)#换行输出
del_num = re.sub("\d+ ", "", result)#去掉每行行首的数字
del_awake = del_num.replace("awake", "")#去掉awake
del_commd = del_awake.replace("commd", "")#去掉commd
del_string1 = re.sub("-a+\d\d\d\d-\d.wav", "", del_commd)#去掉-a0023-1.wav类型的字符串
del_string2 = re.sub("-a+\d\d\d\d.wav", "", del_string1)#去掉-a0016.wav类型的字符串
print(del_string2)

5.执行上面代码,可以取出最后我需要的文本,如图:

使用Python提取文本中含有特定字符串的方法示例

6.拓展

使用Python提取文本中含有特定字符串的方法示例

7.示例代码

import re

str = 'Hello123/World 45_?6bye'
result1 = re.findall('\d',str)#\d匹配任何十进制数
result2 = re.findall('\d+',str)#\d+可匹配一位或多位数字使用
result3 = re.findall('\D',str)#\d匹配非数字字符任何十进制数
result4 = re.findall('\w',str)#\w匹配任何字母数字字符,包括下划线在内
result5 = re.findall('\W',str)#\W匹配非任何字母数字字符,包括下划线在内
result6 = re.findall('\s',str)#\s匹配任何空白字符
result7 = re.findall('\S',str)#\S匹配非任何空白字符
result8 = re.findall('\AHello',str)#\A仅匹配字符串开头
result9 = re.findall('bye\Z',str)#\Z仅匹配字符串结尾
print(result1)
print(result2)
print(result3)
print(result4)
print(result5)
print(result6)
print(result7)
print(result8)
print(result9)

接下来会更几篇关于文本处理的博客,一边学习一边记笔记。加油!

到此这篇关于使用Python提取文本中含有特定字符串的文章就介绍到这了,更多相关Python提取文本特定字符串内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python设置检查点简单实现代码
Jul 01 Python
深入解析Python中的urllib2模块
Nov 13 Python
python模拟Django框架实例
May 17 Python
详解Python多线程
Nov 14 Python
Python实现随机创建电话号码的方法示例
Dec 07 Python
详解Python安装tesserocr遇到的各种问题及解决办法
Mar 07 Python
使用python实现抓取腾讯视频所有电影的爬虫
Apr 15 Python
python如何保证输入键入数字的方法
Aug 23 Python
python常用数据重复项处理方法
Nov 22 Python
Tensorflow轻松实现XOR运算的方式
Feb 03 Python
Python+Django+MySQL实现基于Web版的增删改查的示例代码
May 13 Python
聊一聊python常用的编程模块
May 14 Python
python使用正则表达式匹配txt特定字符串(有换行)
Dec 09 #Python
PyTorch中clone()、detach()及相关扩展详解
Dec 09 #Python
python调用jenkinsAPI构建jenkins,并传递参数的示例
Dec 09 #Python
python excel多行合并的方法
Dec 09 #Python
PyTorch中的拷贝与就地操作详解
Dec 09 #Python
python 调用Google翻译接口的方法
Dec 09 #Python
浅析Python 中的 WSGI 接口和 WSGI 服务的运行
Dec 09 #Python
You might like
php中3des加密代码(完全与.net中的兼容)
2012/08/02 PHP
详解在PHP的Yii框架中使用行为Behaviors的方法
2016/03/18 PHP
PHP的邮件群发系统phplist配置方法详细总结
2016/03/30 PHP
ThinkPHP 5.x远程命令执行漏洞复现
2019/09/23 PHP
ASP中用Join和Array,可以加快字符连接速度的代码
2007/08/22 Javascript
Javascript 跨域访问解决方案
2009/02/14 Javascript
基于jquery的一个图片hover的插件
2010/04/24 Javascript
使用jQuery轻松实现Ajax的实例代码
2010/08/16 Javascript
随鼠标上下滚动的jquery代码
2013/12/05 Javascript
JS案例分享之金额小写转大写
2014/05/15 Javascript
JQuery仿小米手机抢购页面倒计时效果
2014/12/16 Javascript
jQuery实现单击和鼠标感应事件
2015/02/01 Javascript
JavaScript限定图片显示大小的方法
2015/03/11 Javascript
基于JavaScript代码实现pc与手机之间的跳转
2015/12/23 Javascript
JQuery的Pager分页器实现代码
2016/05/03 Javascript
Javascript 基础---Ajax入门必看
2016/07/06 Javascript
javascript与jquery动态创建html元素示例
2016/07/25 Javascript
JavaScript中函数声明与函数表达式的区别详解
2016/08/18 Javascript
Vue中UI组件库之Vuex与虚拟服务器初识
2019/05/07 Javascript
JS数据类型判断的几种常用方法
2020/07/07 Javascript
web.py在模板中输出美元符号的方法
2014/08/26 Python
Python编程中的for循环语句学习教程
2015/10/14 Python
解决python使用open打开文件中文乱码的问题
2017/12/29 Python
Python使用matplotlib绘图无法显示中文问题的解决方法
2018/03/14 Python
python写入并获取剪切板内容的实例
2018/05/31 Python
python中copy()与deepcopy()的区别小结
2018/08/03 Python
python中map的基本用法示例
2018/09/10 Python
基于python实现FTP文件上传与下载操作(ftp&sftp协议)
2020/04/01 Python
如何将json数据转换为python数据
2020/09/04 Python
python中pyplot基础图标函数整理
2020/11/10 Python
英国网上花店:Bunches
2016/11/29 全球购物
意大利一家专营包包和配饰的网上商店:Borse Last Minute
2019/08/26 全球购物
关于旷工的检讨书
2014/02/02 职场文书
建筑工程造价专业自荐信
2014/07/08 职场文书
民主生活会对照检查材料(统计局)
2014/09/21 职场文书
Mysql如何查看是否使用到索引
2022/12/24 MySQL