python3.x提取中文的正则表达式示例代码


Posted in Python onJuly 23, 2019

实例一: 读取txt文件中含有中文的字符

import re ##此处使用的编辑器是python3.x 
d="[\u4e00-\u9fa5]+" #中文匹配的符号
f=open('test.txt','rb') #这里以二进制读取,方便中文的转义 ,不设置回报错 这里的TXT文档
#文档内容:
Hello world
China
你好,你好好
This is a txt File
s2f程序员杂志一2d3程序员杂志二2d3程序员杂志三2d3程序员杂志四2d3
#此处涉及到文本的读取工作,先读取文件,再进行文档行的识别匹配
L=[]#创建一个列表进行存储即将生成的中文
for i in f: #遍历txt文档中的行
  i=i.decode('utf-8')#转意utf-8
  l=re.findall(d,i) #正则匹配中文
  L+=l #将中文放到列表中
print(L)
f.close()

***********************************************

***********************************************

实例二: 读取给定字符串的中文字符

import re ##此处使用的编辑器是python3.x 
s = "s2f程序员杂志一2d3程序员杂志二2d3程序员杂志三2d3程序员杂志四2d3".encode() #此处必须进行字符串转义
temp = s.decode('utf-8') 
pattern="[\u4e00-\u9fa5]+"#中文正则表达式
regex = re.compile(pattern) #生成正则对象 
results = regex.findall(temp) #匹配
for result in results : #迭代遍历出内容
  print (result)

总结

以上所述是小编给大家介绍的python3.x提取中文的正则表达式示例代码,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!
如果你觉得本文对你有帮助,欢迎转载,烦请注明出处,谢谢!

Python 相关文章推荐
Python判断文件和文件夹是否存在的方法
May 21 Python
Python中read()、readline()和readlines()三者间的区别和用法
Jul 30 Python
利用python将图片转换成excel文档格式
Dec 30 Python
Python通过cv2读取多个USB摄像头
Aug 28 Python
Python中关于浮点数的冷知识
Sep 22 Python
pygame实现俄罗斯方块游戏(基础篇3)
Oct 29 Python
Python实现变声器功能(萝莉音御姐音)
Dec 05 Python
pytorch 利用lstm做mnist手写数字识别分类的实例
Jan 10 Python
tensorflow实现读取模型中保存的值 tf.train.NewCheckpointReader
Feb 10 Python
Python numpy大矩阵运算内存不足如何解决
Nov 19 Python
Python调用高德API实现批量地址转经纬度并写入表格的功能
Jan 12 Python
python 详解turtle画爱心代码
Feb 15 Python
Python Pandas 箱线图的实现
Jul 23 #Python
Django 开发调试工具 Django-debug-toolbar使用详解
Jul 23 #Python
Pandas分组与排序的实现
Jul 23 #Python
Python项目 基于Scapy实现SYN泛洪攻击的方法
Jul 23 #Python
Django logging配置及使用详解
Jul 23 #Python
Python利用scapy实现ARP欺骗的方法
Jul 23 #Python
OpenCV3.0+Python3.6实现特定颜色的物体追踪
Jul 23 #Python
You might like
完美实现GIF动画缩略图的php代码
2011/01/02 PHP
php采集内容中带有图片地址的远程图片并保存的方法
2015/01/03 PHP
浅谈PHP值mysql操作类
2016/06/29 PHP
ThinkPHP Where 条件中常用表达式示例(详解)
2017/03/31 PHP
PHP递归的三种常用方式
2019/02/28 PHP
thinkPHP5框架接口写法简单示例
2019/08/05 PHP
Laravel 在views中加载公共页面的实现代码
2019/10/22 PHP
Avengerls vs Newbee BO3 第一场2.18
2021/03/10 DOTA
Javascript排序算法之合并排序(归并排序)的2个例子
2014/04/04 Javascript
js检测输入内容全为空格的方法
2014/05/03 Javascript
所见即所得的富文本编辑器bootstrap-wysiwyg使用方法详解
2016/05/27 Javascript
JS控制TreeView的结点选择
2016/11/11 Javascript
jQuery实现隔行变色的方法分析(对比原生JS)
2016/11/18 Javascript
设置jquery UI 控件的大小方法
2016/12/12 Javascript
json数据处理及数据绑定
2017/01/25 Javascript
jQuery滚动监听实现商城楼梯式导航效果
2017/03/06 Javascript
jquery仿苹果的时间/日期选择效果
2017/03/08 Javascript
vue一步步实现alert功能
2017/07/05 Javascript
基于zepto.js实现手机相册功能
2017/07/11 Javascript
webpack打包js文件及部署的实现方法
2017/12/18 Javascript
Vue三层嵌套路由的示例代码
2018/05/05 Javascript
JS异步处理的进化史深入讲解
2019/08/25 Javascript
javascript代码实现简易计算器
2021/01/25 Javascript
Python内置函数dir详解
2015/04/14 Python
python查看FTP是否能连接成功的方法
2015/07/30 Python
浅谈python中字典append 到list 后值的改变问题
2018/05/04 Python
python爬取网页转换为PDF文件
2018/06/07 Python
Python WSGI的深入理解
2018/08/01 Python
Django model select的多种用法详解
2019/07/16 Python
如何通过Django使用本地css/js文件
2020/01/20 Python
如何通过Python实现RabbitMQ延迟队列
2020/11/28 Python
html5借用repeating-linear-gradient实现一把刻度尺(ruler)
2019/09/09 HTML / CSS
简历中自我评价怎么写
2014/02/12 职场文书
小学毕业演讲稿
2014/04/25 职场文书
工程部岗位职责
2015/02/10 职场文书
导游词之茶卡盐湖
2019/11/26 职场文书