编程 Python

python 用正则表达式筛选文本信息的实例

Posted in Python onJune 05, 2018

本文主要介绍如何对多个文本进行读取，并采用正则表达式对其中的信息进行筛选，将筛选出来的信息存写到一个新文本。

文本基础操作

打开文件：open(‘文件名'，‘打开方式')>>>file=open(r'C:\Users\yuanlei\Desktop\mytxt.txt','w+').为避免报错，在文件名的引号前加个r.

文件打开方式：只读——r或rt,rb为二进制文件；打开文件前清空文件内容——w或wt；在文末写入——a+；

清空内容然后在文末写入——w+；写到文件任意位置——r+;

关闭文件：文件打开运行好后必须要关闭——文件名.close()>>>mytxt.close()

读取文件中的内容：将每行内容，包括换行符，作为一个元素存入数组——lines=file_object.readlines()，但是这样会把换行符也赋进去

去除换行符——new_lines=lines.splitlines()

os包：import os 获取文件地址——os.listdir(父文件地址)

下面附上实现摘要中说的功能的完整代码：

# coding: utf-8
#读取文本中的中英文数据并使用正则表达式将所需数据筛选入到一个新文本中
import re
import os

#zhengze函数对读取到的数据进行筛选，并将筛选好的数据存入数组new_lines
new_lines=[]    #申明new_lines数组
def zhengze(f):
 regex_str=".*?(l.*?e).*"
 for x in f:
  new_x = x.splitlines()  #注意：splitlines是将传入的字符串去除'\n'之后以数组的形式传出，而不是字符串形式
  match_obj=re.match(regex_str,new_x[0])
  if match_obj:
   new_lines.append(match_obj.group(1))
  else:
   new_lines.append('no')
 return new_lines

#获取指定文件夹下的所有文本的绝对地址，并存入数组file_path
path=r'C:\Users\yuanlei\Desktop\new_file_txt'
file_path=[]
for filename in os.listdir(path):  #获取path下所有文件的路径
 file_path.append((os.path.join(path,filename)))
print file_path

#对每个文本调用正则函数进行筛选,筛选过后的数据存入数组final
for adress in file_path:
 file_object=open(adress)
 lines = file_object.readlines( )  #将文本中的内容以数组的形式（每行为一个元素）赋给lines
 file_object.close()
 final=zhengze(lines)
print final

#将筛选出来的数据写入新文本re_new.txt
file_2=open(r'C:\Users\yuanlei\Desktop\re_new.txt','w+')
for x in final:
 file_2.write(x)
 file_2.write('\n')
file_2.close()

以上这篇python 用正则表达式筛选文本信息的实例就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持三水点靠木。

python 用正则表达式筛选文本信息的实例

- Author -

bug_hero

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

python中快速进行多个字符替换的方法小结

Dec 15 Python

Python SQLite3简介

Feb 22 Python

Python中的二维数组实例(list与numpy.array)

Apr 13 Python

Python3几个常见问题的处理方法

Feb 26 Python

Django框架会话技术实例分析【Cookie与Session】

May 24 Python

Python如何爬取微信公众号文章和评论(基于 Fiddler 抓包分析)

Jun 28 Python

python openvc 裁剪、剪切图片提取图片的行和列

Sep 19 Python

python pyinstaller打包exe报错的解决方法

Nov 02 Python

python add_argument()用法解析

Jan 29 Python

Python实现自动签到脚本的示例代码

Aug 19 Python

Pycharm常用快捷键总结及配置方法

Nov 14 Python

python实现图片，视频人脸识别(opencv版)

Nov 18 Python

python和shell获取文本内容的方法

Jun 05 #Python

python 查找文件名包含指定字符串的方法

Jun 05 #Python

Python使用爬虫爬取静态网页图片的方法详解

Jun 05 #Python

Python实现的读写json文件功能示例

Jun 05 #Python

python计算日期之间的放假日期

Jun 05 #Python

python检索特定内容的文本文件实例

Jun 05 #Python

python中利用h5py模块读取h5文件中的主键方法

Jun 05 #Python

You might like

php下删除字符串中HTML标签的函数

2008/08/27 PHP

使用PHP强制下载PDF文件示例

2014/01/17 PHP

使用配置类定义Codeigniter全局变量

2014/06/12 PHP

常见PHP数据库解决方案分析介绍

2015/09/24 PHP

ExtJS实现文件下载的方法实例

2013/11/09 Javascript

js使用数组判断提交数据是否存在相同数据

2013/11/27 Javascript

JS动态添加与删除select中的Option对象(示例代码)

2013/12/20 Javascript

Jquery使用小技巧汇总

2015/12/29 Javascript

通过js控制时间,一秒一秒自己动的实例

2017/10/25 Javascript

用vue写一个仿简书的轮播图的示例代码

2018/03/13 Javascript

关于单文件组件.vue的使用

2018/09/20 Javascript

vue将后台数据时间戳转换成日期格式

2019/07/31 Javascript

vue在路由中验证token是否存在的简单实现

2019/11/11 Javascript

js页面加载后执行的几种方式小结

2020/01/30 Javascript

详解vue中在循环中使用@mouseenter 和 @mouseleave事件闪烁问题解决方法

2020/04/07 Javascript

javascript设计模式 ? 外观模式原理与用法实例分析

2020/04/15 Javascript

在Python下利用OpenCV来旋转图像的教程

2015/04/16 Python

使用Django启动命令行及执行脚本的方法

2018/05/29 Python

Python实战购物车项目的实现参考

2019/02/20 Python

python3读取csv文件任意行列代码实例

2020/01/13 Python

巧用CSS3 border实现图片遮罩效果代码

2012/04/09 HTML / CSS

CSS3 :not()选择器实现最后一行li去除某种css样式

2016/10/19 HTML / CSS

HTML5 Canvas图像模糊完美解决办法

2018/02/06 HTML / CSS

深入剖析HTML5 内联框架iFrame

2016/05/04 HTML / CSS

Shop Apotheke瑞士：您的健康与美容网上商店

2019/10/09 全球购物

Vuori官网：运动服装的终级表现

2021/01/27 全球购物

生产车间主管岗位职责

2013/12/28 职场文书

期末自我鉴定

2014/01/23 职场文书

护士进修自我鉴定

2014/02/07 职场文书

出资证明书范本（标准版）

2014/09/24 职场文书

外贸英文求职信范文

2015/03/19 职场文书

端午节寄语2015

2015/03/23 职场文书

2016教师节问候语

2015/11/10 职场文书

导游词之寿县报恩寺

2020/01/19 职场文书

Python3.10的一些新特性原理分析

2021/09/15 Python

vue postcss-px2rem 自适应布局

2022/05/15 Vue.js