python3.x提取中文的正则表达式示例代码


Posted in Python onJuly 23, 2019

实例一: 读取txt文件中含有中文的字符

import re ##此处使用的编辑器是python3.x 
d="[\u4e00-\u9fa5]+" #中文匹配的符号
f=open('test.txt','rb') #这里以二进制读取,方便中文的转义 ,不设置回报错 这里的TXT文档
#文档内容:
Hello world
China
你好,你好好
This is a txt File
s2f程序员杂志一2d3程序员杂志二2d3程序员杂志三2d3程序员杂志四2d3
#此处涉及到文本的读取工作,先读取文件,再进行文档行的识别匹配
L=[]#创建一个列表进行存储即将生成的中文
for i in f: #遍历txt文档中的行
  i=i.decode('utf-8')#转意utf-8
  l=re.findall(d,i) #正则匹配中文
  L+=l #将中文放到列表中
print(L)
f.close()

***********************************************

***********************************************

实例二: 读取给定字符串的中文字符

import re ##此处使用的编辑器是python3.x 
s = "s2f程序员杂志一2d3程序员杂志二2d3程序员杂志三2d3程序员杂志四2d3".encode() #此处必须进行字符串转义
temp = s.decode('utf-8') 
pattern="[\u4e00-\u9fa5]+"#中文正则表达式
regex = re.compile(pattern) #生成正则对象 
results = regex.findall(temp) #匹配
for result in results : #迭代遍历出内容
  print (result)

总结

以上所述是小编给大家介绍的python3.x提取中文的正则表达式示例代码,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!
如果你觉得本文对你有帮助,欢迎转载,烦请注明出处,谢谢!

Python 相关文章推荐
Python中的exec、eval使用实例
Sep 23 Python
Python 抓取动态网页内容方案详解
Dec 25 Python
Python模拟登录12306的方法
Dec 30 Python
Python3使用requests登录人人影视网站的方法
May 11 Python
使用python实现ANN
Dec 20 Python
Python扩展内置类型详解
Mar 26 Python
使用Python3+PyQT5+Pyserial 实现简单的串口工具方法
Feb 13 Python
Python 分发包中添加额外文件的方法
Aug 16 Python
Python 类属性与实例属性,类对象与实例对象用法分析
Sep 20 Python
Python操作Excel把数据分给sheet
May 20 Python
python 如何设置守护进程
Oct 29 Python
关于探究python中sys.argv时遇到的问题详解
Feb 23 Python
Python Pandas 箱线图的实现
Jul 23 #Python
Django 开发调试工具 Django-debug-toolbar使用详解
Jul 23 #Python
Pandas分组与排序的实现
Jul 23 #Python
Python项目 基于Scapy实现SYN泛洪攻击的方法
Jul 23 #Python
Django logging配置及使用详解
Jul 23 #Python
Python利用scapy实现ARP欺骗的方法
Jul 23 #Python
OpenCV3.0+Python3.6实现特定颜色的物体追踪
Jul 23 #Python
You might like
PHP 编程请选择正确的文本编辑软件
2006/12/21 PHP
JoshChen_php新手进阶高手不可或缺的规范介绍
2013/08/16 PHP
学习php设计模式 php实现访问者模式(Visitor)
2015/12/07 PHP
laravel框架之数据库查出来的对象实现转化为数组
2019/10/23 PHP
跟着JQuery API学Jquery 之二 属性
2010/04/09 Javascript
重构Javascript代码示例(重构前后对比)
2013/01/23 Javascript
jquery时间下拉框小例子
2013/04/15 Javascript
浅析js中2个等号与3个等号的区别
2013/08/06 Javascript
display和visibility的区别示例介绍
2014/02/26 Javascript
JavaScript实现穷举排列(permutation)算法谜题解答
2014/12/29 Javascript
JS实现点击颜色块切换指定区域背景颜色的方法
2015/02/25 Javascript
js实现文本框中输入文字页面中div层同步获取文本框内容的方法
2015/03/03 Javascript
js+html5通过canvas指定开始和结束点绘制线条的方法
2015/06/05 Javascript
jquery判断复选框是否被选中的方法
2015/10/16 Javascript
JS常见问题之为什么点击弹出的i总是最后一个
2016/01/05 Javascript
JavaScript中子对象访问父对象的方式详解
2016/09/01 Javascript
在js中实现邮箱格式的验证方法(推荐)
2016/10/24 Javascript
纯js实现隔行变色效果
2017/11/29 Javascript
select2 ajax 设置默认值,初始值的方法
2018/08/09 Javascript
JS实现根据数组对象的某一属性排序操作示例
2019/01/14 Javascript
JavaScript的Proxy可以做哪些有意思的事儿
2019/06/15 Javascript
Python 正则表达式(转义问题)
2014/12/15 Python
部署Python的框架下的web app的详细教程
2015/04/30 Python
Python文件操作,open读写文件,追加文本内容实例
2016/12/14 Python
python 对dataframe下面的值进行大规模赋值方法
2018/06/09 Python
python使用pipeline批量读写redis的方法
2019/02/18 Python
Pandas 重塑(stack)和轴向旋转(pivot)的实现
2019/07/22 Python
Python爬虫爬取百度搜索内容代码实例
2020/06/05 Python
英国工艺品购物网站:Minerva Crafts
2018/01/29 全球购物
教师自我鉴定范文
2013/11/10 职场文书
捐书寄语赠言
2014/01/18 职场文书
经典婚礼主持开场白
2014/03/13 职场文书
校庆口号
2014/06/20 职场文书
基层党支部承诺书
2015/04/30 职场文书
《刷子李》教学反思
2016/02/20 职场文书
idea 在springboot中使用lombok插件的方法
2021/08/02 Java/Android