python3.x提取中文的正则表达式示例代码


Posted in Python onJuly 23, 2019

实例一: 读取txt文件中含有中文的字符

import re ##此处使用的编辑器是python3.x 
d="[\u4e00-\u9fa5]+" #中文匹配的符号
f=open('test.txt','rb') #这里以二进制读取,方便中文的转义 ,不设置回报错 这里的TXT文档
#文档内容:
Hello world
China
你好,你好好
This is a txt File
s2f程序员杂志一2d3程序员杂志二2d3程序员杂志三2d3程序员杂志四2d3
#此处涉及到文本的读取工作,先读取文件,再进行文档行的识别匹配
L=[]#创建一个列表进行存储即将生成的中文
for i in f: #遍历txt文档中的行
  i=i.decode('utf-8')#转意utf-8
  l=re.findall(d,i) #正则匹配中文
  L+=l #将中文放到列表中
print(L)
f.close()

***********************************************

***********************************************

实例二: 读取给定字符串的中文字符

import re ##此处使用的编辑器是python3.x 
s = "s2f程序员杂志一2d3程序员杂志二2d3程序员杂志三2d3程序员杂志四2d3".encode() #此处必须进行字符串转义
temp = s.decode('utf-8') 
pattern="[\u4e00-\u9fa5]+"#中文正则表达式
regex = re.compile(pattern) #生成正则对象 
results = regex.findall(temp) #匹配
for result in results : #迭代遍历出内容
  print (result)

总结

以上所述是小编给大家介绍的python3.x提取中文的正则表达式示例代码,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!
如果你觉得本文对你有帮助,欢迎转载,烦请注明出处,谢谢!

Python 相关文章推荐
Python标准库之随机数 (math包、random包)介绍
Nov 25 Python
python通过文件头判断文件类型
Oct 30 Python
python3使用requests模块爬取页面内容的实战演练
Sep 25 Python
python matplotlib中文显示参数设置解析
Dec 15 Python
python 爬虫 批量获取代理ip的实例代码
May 22 Python
浅谈Pycharm中的Python Console与Terminal
Jan 17 Python
python实现蒙特卡罗方法教程
Jan 28 Python
解决Django Static内容不能加载显示的问题
Jul 28 Python
python新手学习使用库
Jun 11 Python
哪种Python框架适合你?简单介绍几种主流Python框架
Aug 04 Python
Python用摘要算法生成token及检验token的示例代码
Dec 01 Python
如何通过安装HomeBrew来安装Python3
Dec 23 Python
Python Pandas 箱线图的实现
Jul 23 #Python
Django 开发调试工具 Django-debug-toolbar使用详解
Jul 23 #Python
Pandas分组与排序的实现
Jul 23 #Python
Python项目 基于Scapy实现SYN泛洪攻击的方法
Jul 23 #Python
Django logging配置及使用详解
Jul 23 #Python
Python利用scapy实现ARP欺骗的方法
Jul 23 #Python
OpenCV3.0+Python3.6实现特定颜色的物体追踪
Jul 23 #Python
You might like
PHP eval函数使用介绍
2013/12/08 PHP
PHP实现生成带背景的图形验证码功能
2016/10/03 PHP
javascript之dhDataGrid Ver2.0.0代码
2007/07/01 Javascript
js 发个判断字符串是否为符合标准的函数
2009/04/27 Javascript
jQuery源码分析-03构造jQuery对象-源码结构和核心函数
2011/11/14 Javascript
JS+CSS 制作的超级简单的下拉菜单附图
2013/11/22 Javascript
为何JS操作的href都是javascript:void(0);呢
2015/11/12 Javascript
jQuery.form插件的使用及跨域异步上传文件
2016/04/27 Javascript
Node.js服务器环境下使用Mock.js拦截AJAX请求的教程
2016/05/23 Javascript
精彩的Bootstrap案例分享 重点在注释!(选项卡、栅格布局)
2016/07/01 Javascript
jQuery实现点击任意位置弹出层外关闭弹出层效果
2016/10/19 Javascript
iview table render集成switch开关的实例
2018/03/14 Javascript
详解JavaScript之Array.reduce源码解读
2020/11/01 Javascript
[42:52]Optic vs Serenity 2018国际邀请赛淘汰赛BO3 第二场 8.22
2018/08/23 DOTA
50行代码实现贪吃蛇(具体思路及代码)
2013/04/27 Python
Python多线程编程(七):使用Condition实现复杂同步
2015/04/05 Python
Python functools模块学习总结
2015/05/09 Python
python获取网页中所有图片并筛选指定分辨率的方法
2018/03/31 Python
Python使用Selenium爬取淘宝异步加载的数据方法
2018/12/17 Python
pandas 数据结构之Series的使用方法
2019/06/21 Python
Django自定义模板过滤器和标签的实现方法
2019/08/21 Python
如何用OpenCV -python3实现视频物体追踪
2019/12/04 Python
python使用beautifulsoup4爬取酷狗音乐代码实例
2019/12/04 Python
Python中如何添加自定义模块
2020/06/09 Python
python中get和post有什么区别
2020/06/19 Python
CSS3 画基本图形,圆形、椭圆形、三角形等
2016/09/20 HTML / CSS
BIBLOO波兰:捷克的一家在线服装店
2018/03/09 全球购物
德国大型箱包和皮具商店:Koffer
2019/10/01 全球购物
学校后勤人员职责
2013/12/27 职场文书
教师评优事迹材料
2014/01/10 职场文书
音乐专业自荐信
2014/02/07 职场文书
颁奖典礼主持词
2014/03/25 职场文书
党校个人自我鉴定范文
2014/03/28 职场文书
白酒营销策划方案
2014/08/17 职场文书
公证委托书格式
2014/09/13 职场文书
2016年“我们的节日·中秋节”活动总结
2016/04/05 职场文书