python 用正则表达式筛选文本信息的实例


Posted in Python onJune 05, 2018

本文主要介绍如何对多个文本进行读取,并采用正则表达式对其中的信息进行筛选,将筛选出来的信息存写到一个新文本。

文本基础操作

打开文件:open(‘文件名',‘打开方式')>>>file=open(r'C:\Users\yuanlei\Desktop\mytxt.txt','w+').为避免报错,在文件名的引号前加个r.

文件打开方式:只读——r或rt,rb为二进制文件;打开文件前清空文件内容——w或wt;在文末写入——a+;

清空内容然后在文末写入——w+;写到文件任意位置——r+;

关闭文件:文件打开运行好后必须要关闭——文件名.close()>>>mytxt.close()

读取文件中的内容:将每行内容,包括换行符,作为一个元素存入数组——lines=file_object.readlines(),但是这样会把换行符也赋进去

去除换行符——new_lines=lines.splitlines()

os包:import os 获取文件地址——os.listdir(父文件地址)

下面附上实现摘要中说的功能的完整代码:

# coding: utf-8
#读取文本中的中英文数据并使用正则表达式将所需数据筛选入到一个新文本中
import re
import os

#zhengze函数对读取到的数据进行筛选,并将筛选好的数据存入数组new_lines
new_lines=[]    #申明new_lines数组
def zhengze(f):
 regex_str=".*?(l.*?e).*"
 for x in f:
  new_x = x.splitlines()  #注意:splitlines是将传入的字符串去除'\n'之后以数组的形式传出,而不是字符串形式
  match_obj=re.match(regex_str,new_x[0])
  if match_obj:
   new_lines.append(match_obj.group(1))
  else:
   new_lines.append('no')
 return new_lines

#获取指定文件夹下的所有文本的绝对地址,并存入数组file_path
path=r'C:\Users\yuanlei\Desktop\new_file_txt'
file_path=[]
for filename in os.listdir(path):  #获取path下所有文件的路径
 file_path.append((os.path.join(path,filename)))
print file_path

#对每个文本调用正则函数进行筛选,筛选过后的数据存入数组final
for adress in file_path:
 file_object=open(adress)
 lines = file_object.readlines( )  #将文本中的内容以数组的形式(每行为一个元素)赋给lines
 file_object.close()
 final=zhengze(lines)
print final

#将筛选出来的数据写入新文本re_new.txt
file_2=open(r'C:\Users\yuanlei\Desktop\re_new.txt','w+')
for x in final:
 file_2.write(x)
 file_2.write('\n')
file_2.close()

以上这篇python 用正则表达式筛选文本信息的实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python中快速进行多个字符替换的方法小结
Dec 15 Python
Python SQLite3简介
Feb 22 Python
Python中的二维数组实例(list与numpy.array)
Apr 13 Python
Python3几个常见问题的处理方法
Feb 26 Python
Django框架会话技术实例分析【Cookie与Session】
May 24 Python
Python如何爬取微信公众号文章和评论(基于 Fiddler 抓包分析)
Jun 28 Python
python openvc 裁剪、剪切图片 提取图片的行和列
Sep 19 Python
python pyinstaller打包exe报错的解决方法
Nov 02 Python
python add_argument()用法解析
Jan 29 Python
Python实现自动签到脚本的示例代码
Aug 19 Python
Pycharm常用快捷键总结及配置方法
Nov 14 Python
python实现图片,视频人脸识别(opencv版)
Nov 18 Python
python和shell获取文本内容的方法
Jun 05 #Python
python 查找文件名包含指定字符串的方法
Jun 05 #Python
Python使用爬虫爬取静态网页图片的方法详解
Jun 05 #Python
Python实现的读写json文件功能示例
Jun 05 #Python
python计算日期之间的放假日期
Jun 05 #Python
python检索特定内容的文本文件实例
Jun 05 #Python
python中利用h5py模块读取h5文件中的主键方法
Jun 05 #Python
You might like
php下删除字符串中HTML标签的函数
2008/08/27 PHP
使用PHP强制下载PDF文件示例
2014/01/17 PHP
使用配置类定义Codeigniter全局变量
2014/06/12 PHP
常见PHP数据库解决方案分析介绍
2015/09/24 PHP
ExtJS实现文件下载的方法实例
2013/11/09 Javascript
js使用数组判断提交数据是否存在相同数据
2013/11/27 Javascript
JS动态添加与删除select中的Option对象(示例代码)
2013/12/20 Javascript
Jquery使用小技巧汇总
2015/12/29 Javascript
通过js控制时间,一秒一秒自己动的实例
2017/10/25 Javascript
用vue写一个仿简书的轮播图的示例代码
2018/03/13 Javascript
关于单文件组件.vue的使用
2018/09/20 Javascript
vue将后台数据时间戳转换成日期格式
2019/07/31 Javascript
vue在路由中验证token是否存在的简单实现
2019/11/11 Javascript
js页面加载后执行的几种方式小结
2020/01/30 Javascript
详解vue中在循环中使用@mouseenter 和 @mouseleave事件闪烁问题解决方法
2020/04/07 Javascript
javascript设计模式 ? 外观模式原理与用法实例分析
2020/04/15 Javascript
在Python下利用OpenCV来旋转图像的教程
2015/04/16 Python
使用Django启动命令行及执行脚本的方法
2018/05/29 Python
Python实战购物车项目的实现参考
2019/02/20 Python
python3读取csv文件任意行列代码实例
2020/01/13 Python
巧用CSS3 border实现图片遮罩效果代码
2012/04/09 HTML / CSS
CSS3 :not()选择器实现最后一行li去除某种css样式
2016/10/19 HTML / CSS
HTML5 Canvas图像模糊完美解决办法
2018/02/06 HTML / CSS
深入剖析HTML5 内联框架iFrame
2016/05/04 HTML / CSS
Shop Apotheke瑞士:您的健康与美容网上商店
2019/10/09 全球购物
Vuori官网:运动服装的终级表现
2021/01/27 全球购物
生产车间主管岗位职责
2013/12/28 职场文书
期末自我鉴定
2014/01/23 职场文书
护士进修自我鉴定
2014/02/07 职场文书
出资证明书范本(标准版)
2014/09/24 职场文书
外贸英文求职信范文
2015/03/19 职场文书
端午节寄语2015
2015/03/23 职场文书
2016教师节问候语
2015/11/10 职场文书
导游词之寿县报恩寺
2020/01/19 职场文书
Python3.10的一些新特性原理分析
2021/09/15 Python
vue postcss-px2rem 自适应布局
2022/05/15 Vue.js