python3.x提取中文的正则表达式示例代码


Posted in Python onJuly 23, 2019

实例一: 读取txt文件中含有中文的字符

import re ##此处使用的编辑器是python3.x 
d="[\u4e00-\u9fa5]+" #中文匹配的符号
f=open('test.txt','rb') #这里以二进制读取,方便中文的转义 ,不设置回报错 这里的TXT文档
#文档内容:
Hello world
China
你好,你好好
This is a txt File
s2f程序员杂志一2d3程序员杂志二2d3程序员杂志三2d3程序员杂志四2d3
#此处涉及到文本的读取工作,先读取文件,再进行文档行的识别匹配
L=[]#创建一个列表进行存储即将生成的中文
for i in f: #遍历txt文档中的行
  i=i.decode('utf-8')#转意utf-8
  l=re.findall(d,i) #正则匹配中文
  L+=l #将中文放到列表中
print(L)
f.close()

***********************************************

***********************************************

实例二: 读取给定字符串的中文字符

import re ##此处使用的编辑器是python3.x 
s = "s2f程序员杂志一2d3程序员杂志二2d3程序员杂志三2d3程序员杂志四2d3".encode() #此处必须进行字符串转义
temp = s.decode('utf-8') 
pattern="[\u4e00-\u9fa5]+"#中文正则表达式
regex = re.compile(pattern) #生成正则对象 
results = regex.findall(temp) #匹配
for result in results : #迭代遍历出内容
  print (result)

总结

以上所述是小编给大家介绍的python3.x提取中文的正则表达式示例代码,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!
如果你觉得本文对你有帮助,欢迎转载,烦请注明出处,谢谢!

Python 相关文章推荐
python实现去除下载电影和电视剧文件名中的多余字符的方法
Sep 23 Python
进一步探究Python中的正则表达式
Apr 28 Python
python基于socket实现网络广播的方法
Apr 29 Python
python获取指定时间差的时间实例详解
Apr 11 Python
Python随机生成均匀分布在三角形内或者任意多边形内的点
Dec 14 Python
对python中的 os.mkdir和os.mkdirs详解
Oct 16 Python
python实现简单登陆系统
Oct 18 Python
python滑块验证码的破解实现
Nov 10 Python
python机器学习实现决策树
Nov 11 Python
Python 剪绳子的多种思路实现(动态规划和贪心)
Feb 24 Python
python读取excel数据并且画图的实现示例
Feb 08 Python
Python基础学习之奇异的GUI对话框
May 27 Python
Python Pandas 箱线图的实现
Jul 23 #Python
Django 开发调试工具 Django-debug-toolbar使用详解
Jul 23 #Python
Pandas分组与排序的实现
Jul 23 #Python
Python项目 基于Scapy实现SYN泛洪攻击的方法
Jul 23 #Python
Django logging配置及使用详解
Jul 23 #Python
Python利用scapy实现ARP欺骗的方法
Jul 23 #Python
OpenCV3.0+Python3.6实现特定颜色的物体追踪
Jul 23 #Python
You might like
用PHP连接Oracle数据库
2006/10/09 PHP
PHP读MYSQL中文乱码的解决方法
2006/12/17 PHP
PHP学习之字符串比较和查找
2011/04/17 PHP
PHP中SESSION的注销与清除
2015/04/16 PHP
PHP的Socket通信之UDP通信实例
2015/07/02 PHP
PHP图形操作之Jpgraph学习笔记
2015/12/25 PHP
Yii2实现上下联动下拉框功能的方法
2016/08/10 PHP
php基于自定义函数记录log日志方法
2017/07/21 PHP
THINKPHP-Apache服务器中使用Alias虚拟目录URL重写 隐藏index.php
2021/03/09 PHP
js兼容的placeholder属性详解
2013/08/18 Javascript
jquery live()调用不存在的解决方法
2014/02/26 Javascript
Node.js中的process.nextTick使用实例
2015/06/25 Javascript
jQuery实现折叠、展开的菜单组效果代码
2015/09/16 Javascript
详解javascript跨浏览器事件处理程序
2016/03/27 Javascript
移动端 一个简单易懂的弹出框
2016/07/06 Javascript
jquery遍历标签中自定义的属性方法
2016/09/17 Javascript
详解javascript获取url信息的常见方法
2016/12/19 Javascript
微信小程序 http请求的session管理
2017/06/07 Javascript
ajax请求data遇到的问题分析
2018/01/18 Javascript
Nodejs让异步变成同步的方法
2019/03/02 NodeJs
微信小程序实现点击效果
2019/06/21 Javascript
零基础使用Python读写处理Excel表格的方法
2019/05/02 Python
对python中的装包与解包实例详解
2019/08/24 Python
python pprint模块中print()和pprint()两者的区别
2020/02/10 Python
TensorFlow中如何确定张量的形状实例
2020/06/23 Python
Nuts.com:优质散装,批发坚果、干果和巧克力等
2017/03/21 全球购物
梅西百货澳大利亚:Macy’s Australia
2017/07/26 全球购物
捷克家居装饰及图书音像购物网站:Velký košík
2018/04/16 全球购物
美国乒乓球设备、配件和服装品牌:Killerspin
2020/06/07 全球购物
小学生新学期寄语
2014/01/19 职场文书
暑期培训随笔感言
2014/03/10 职场文书
小学“向国旗敬礼”网上签名寄语活动总结
2014/09/27 职场文书
2014年采购员工作总结
2014/11/18 职场文书
教师先进个人材料
2014/12/17 职场文书
会计入职心得体会
2016/01/22 职场文书
2016年党员公开承诺书格式范文
2016/03/24 职场文书