使用Python提取文本中含有特定字符串的方法示例


Posted in Python onDecember 09, 2020

今天搞了一天的文本处理,发现python真的太适合做数据处理了。废话不多说,一起学习吧!

1.我的原始数据是这样的,如图

使用Python提取文本中含有特定字符串的方法示例

2.如果要提取每行含有pass的字符串,代码如下:

import re

filepath = "E:/untitled1/analyze_log/test.log"
txt = open(filepath, "r").read()

result=""
test_text = re.findall("..............+pass", txt)#取出每行含有pass的文本
result = result +'\n'.join(test_text)#换行输出
print(result)

3.执行上面代码,可以取出每行含有pass的文本,如图:

使用Python提取文本中含有特定字符串的方法示例

4.其实我真正要提取的是每行类似上图红色框内的字符串,代码实现如下:

import re

filepath = "E:/untitled1/analyze_log/test.log"
txt = open(filepath, "r").read()

result=""
test_text = re.findall("..............+pass", txt)#取出每行含有pass的文本
result = result +'\n'.join(test_text)#换行输出
del_num = re.sub("\d+ ", "", result)#去掉每行行首的数字
del_awake = del_num.replace("awake", "")#去掉awake
del_commd = del_awake.replace("commd", "")#去掉commd
del_string1 = re.sub("-a+\d\d\d\d-\d.wav", "", del_commd)#去掉-a0023-1.wav类型的字符串
del_string2 = re.sub("-a+\d\d\d\d.wav", "", del_string1)#去掉-a0016.wav类型的字符串
print(del_string2)

5.执行上面代码,可以取出最后我需要的文本,如图:

使用Python提取文本中含有特定字符串的方法示例

6.拓展

使用Python提取文本中含有特定字符串的方法示例

7.示例代码

import re

str = 'Hello123/World 45_?6bye'
result1 = re.findall('\d',str)#\d匹配任何十进制数
result2 = re.findall('\d+',str)#\d+可匹配一位或多位数字使用
result3 = re.findall('\D',str)#\d匹配非数字字符任何十进制数
result4 = re.findall('\w',str)#\w匹配任何字母数字字符,包括下划线在内
result5 = re.findall('\W',str)#\W匹配非任何字母数字字符,包括下划线在内
result6 = re.findall('\s',str)#\s匹配任何空白字符
result7 = re.findall('\S',str)#\S匹配非任何空白字符
result8 = re.findall('\AHello',str)#\A仅匹配字符串开头
result9 = re.findall('bye\Z',str)#\Z仅匹配字符串结尾
print(result1)
print(result2)
print(result3)
print(result4)
print(result5)
print(result6)
print(result7)
print(result8)
print(result9)

接下来会更几篇关于文本处理的博客,一边学习一边记笔记。加油!

到此这篇关于使用Python提取文本中含有特定字符串的文章就介绍到这了,更多相关Python提取文本特定字符串内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python相似模块用例
Mar 04 Python
使用python的pexpect模块,实现远程免密登录的示例
Feb 14 Python
对python 多线程中的守护线程与join的用法详解
Feb 18 Python
Django 重写用户模型的实现
Jul 29 Python
更新pip3与pyttsx3文字语音转换的实现方法
Aug 08 Python
Numpy的简单用法小结
Aug 28 Python
Python 函数用法简单示例【定义、参数、返回值、函数嵌套】
Sep 20 Python
python名片管理系统开发
Jun 18 Python
教你使用Sublime text3搭建Python开发环境及常用插件安装另分享Sublime text3最新激活注册码
Nov 12 Python
python asyncio 协程库的使用
Jan 21 Python
Pyhton模块和包相关知识总结
May 12 Python
教你怎么用Python操作MySql数据库
May 31 Python
python使用正则表达式匹配txt特定字符串(有换行)
Dec 09 #Python
PyTorch中clone()、detach()及相关扩展详解
Dec 09 #Python
python调用jenkinsAPI构建jenkins,并传递参数的示例
Dec 09 #Python
python excel多行合并的方法
Dec 09 #Python
PyTorch中的拷贝与就地操作详解
Dec 09 #Python
python 调用Google翻译接口的方法
Dec 09 #Python
浅析Python 中的 WSGI 接口和 WSGI 服务的运行
Dec 09 #Python
You might like
php中截取中文字符串的代码小结
2011/07/17 PHP
163的邮件用phpmailer发送(实例详解)
2013/06/24 PHP
Laravel 4 初级教程之视图、命名空间、路由
2014/10/30 PHP
php实现约瑟夫问题的方法小结
2015/03/23 PHP
header与缓冲区之间的深层次分析
2016/07/30 PHP
php lcg_value与mt_rand生成0~1随机小数的效果对比分析
2017/04/05 PHP
详解在YII2框架中使用UEditor编辑器发布文章
2018/11/02 PHP
PHP PDOStatement::debugDumpParams讲解
2019/01/30 PHP
Linux下源码包安装Swoole及基本使用操作图文详解
2019/04/02 PHP
php ActiveMQ的安装与使用方法图文教程
2020/02/23 PHP
菜单效果
2006/10/14 Javascript
jquery 模拟类搜索框自动完成搜索提示功能(改进)
2010/05/24 Javascript
javascript中普通函数的使用介绍
2013/12/19 Javascript
自编jQuery插件实现模拟alert和confirm
2014/09/01 Javascript
js与jquery回车提交的方法
2015/02/03 Javascript
js实现最短的XML格式化工具实例
2015/03/12 Javascript
JavaScript中的substr()方法使用详解
2015/06/06 Javascript
JS使用cookie设置样式的方法
2016/06/30 Javascript
移动端基础事件总结与应用
2017/01/12 Javascript
微信小程序之picker日期和时间选择器
2017/02/09 Javascript
javascript内存分配原理实例分析
2017/04/10 Javascript
JavaScript数据结构之二叉树的遍历算法示例
2017/04/13 Javascript
JavaScript之生成器_动力节点Java学院整理
2017/06/30 Javascript
JS中async/await实现异步调用的方法
2019/08/28 Javascript
VSCode搭建Vue项目的方法
2020/04/30 Javascript
[01:33]一分钟玩转DOTA2第三弹:DOTA2&DotA快捷操作大对比
2014/06/04 DOTA
python教程之用py2exe将PY文件转成EXE文件
2014/06/12 Python
Python中的descriptor描述器简明使用指南
2016/06/02 Python
Python下调用Linux的Shell命令的方法
2018/06/12 Python
PyQt5 实现给窗口设置背景图片的方法
2019/06/13 Python
PyQt4 treewidget 选择改变颜色,并设置可编辑的方法
2019/06/17 Python
英国门把手公司:Door Handle Company
2019/05/12 全球购物
房地产置业顾问工作总结
2015/10/23 职场文书
《我们的民族小学》教学反思
2016/02/19 职场文书
Golang之sync.Pool使用详解
2021/05/06 Golang
pandas DataFrame.shift()函数的具体使用
2021/05/24 Python