python3.x提取中文的正则表达式示例代码


Posted in Python onJuly 23, 2019

实例一: 读取txt文件中含有中文的字符

import re ##此处使用的编辑器是python3.x 
d="[\u4e00-\u9fa5]+" #中文匹配的符号
f=open('test.txt','rb') #这里以二进制读取,方便中文的转义 ,不设置回报错 这里的TXT文档
#文档内容:
Hello world
China
你好,你好好
This is a txt File
s2f程序员杂志一2d3程序员杂志二2d3程序员杂志三2d3程序员杂志四2d3
#此处涉及到文本的读取工作,先读取文件,再进行文档行的识别匹配
L=[]#创建一个列表进行存储即将生成的中文
for i in f: #遍历txt文档中的行
  i=i.decode('utf-8')#转意utf-8
  l=re.findall(d,i) #正则匹配中文
  L+=l #将中文放到列表中
print(L)
f.close()

***********************************************

***********************************************

实例二: 读取给定字符串的中文字符

import re ##此处使用的编辑器是python3.x 
s = "s2f程序员杂志一2d3程序员杂志二2d3程序员杂志三2d3程序员杂志四2d3".encode() #此处必须进行字符串转义
temp = s.decode('utf-8') 
pattern="[\u4e00-\u9fa5]+"#中文正则表达式
regex = re.compile(pattern) #生成正则对象 
results = regex.findall(temp) #匹配
for result in results : #迭代遍历出内容
  print (result)

总结

以上所述是小编给大家介绍的python3.x提取中文的正则表达式示例代码,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!
如果你觉得本文对你有帮助,欢迎转载,烦请注明出处,谢谢!

Python 相关文章推荐
python动态加载变量示例分享
Feb 17 Python
python中的多线程实例教程
Aug 27 Python
使用Python脚本来获取Cisco设备信息的示例
May 04 Python
Linux 发邮件磁盘空间监控(python)
Apr 23 Python
连接pandas以及数组转pandas的方法
Jun 28 Python
Python实现微信翻译机器人的方法
Aug 13 Python
关于Python3 类方法、静态方法新解
Aug 30 Python
在Windows上安装和配置 Jupyter Lab 作为桌面级应用程序教程
Apr 22 Python
Python爬虫爬取博客实现可视化过程解析
Jun 29 Python
pycharm 2020 1.1的安装流程
Sep 29 Python
Python的scikit-image模块实例讲解
Dec 30 Python
python脚本框架webpy模板赋值实现
Nov 20 Python
Python Pandas 箱线图的实现
Jul 23 #Python
Django 开发调试工具 Django-debug-toolbar使用详解
Jul 23 #Python
Pandas分组与排序的实现
Jul 23 #Python
Python项目 基于Scapy实现SYN泛洪攻击的方法
Jul 23 #Python
Django logging配置及使用详解
Jul 23 #Python
Python利用scapy实现ARP欺骗的方法
Jul 23 #Python
OpenCV3.0+Python3.6实现特定颜色的物体追踪
Jul 23 #Python
You might like
杏林同学录(五)
2006/10/09 PHP
php SQL防注入代码集合
2008/04/25 PHP
php setcookie函数的参数说明及其用法
2014/04/20 PHP
php通过记录IP来防止表单重复提交方法分析
2014/12/16 PHP
php简单实现无限分类树形列表的方法
2015/03/27 PHP
浅谈PHP中try{}catch{}的使用方法
2016/12/09 PHP
php数组实现根据某个键值将相同键值合并生成新二维数组的方法
2017/04/26 PHP
laravel 框架配置404等异常页面
2019/01/07 PHP
JSON格式的键盘编码对照表
2015/01/29 Javascript
简介JavaScript中Math.cos()余弦方法的使用
2015/06/15 Javascript
javascript 操作cookies详解及实例
2017/02/22 Javascript
文本溢出插件jquery.dotdotdot.js使用方法详解
2017/06/22 jQuery
Node.js 使用流实现读写同步边读边写功能
2017/09/11 Javascript
js 获取json数组里面数组的长度实例
2017/10/31 Javascript
vue-cli脚手架config目录下index.js配置文件的方法
2018/03/13 Javascript
Element中的Cascader(级联列表)动态加载省\市\区数据的方法
2019/03/27 Javascript
layui 动态设置checbox 选中状态的例子
2019/09/02 Javascript
从Node.js事件触发器到Vue自定义事件的深入讲解
2020/06/26 Javascript
vue.js watch经常失效的场景与解决方案
2021/01/07 Vue.js
[52:52]完美世界DOTA2联赛PWL S3 LBZS vs access 第一场 12.10
2020/12/13 DOTA
python实现从网络下载文件并获得文件大小及类型的方法
2015/04/28 Python
Python存取XML的常见方法实例分析
2017/03/21 Python
Python3删除排序数组中重复项的方法分析
2019/01/31 Python
pyqt实现.ui文件批量转换为对应.py文件脚本
2019/06/19 Python
python主线程与子线程的结束顺序实例解析
2019/12/17 Python
python爬虫爬取图片的简单代码
2021/01/18 Python
css3圆角边框和边框阴影示例
2014/05/05 HTML / CSS
房屋改造计划书
2014/01/10 职场文书
企业整改报告范文
2014/11/08 职场文书
五一劳动节活动总结
2015/02/09 职场文书
2015年反洗钱工作总结
2015/04/25 职场文书
小平小道观后感
2015/06/09 职场文书
七夕情人节问候语
2015/11/11 职场文书
56句经典英文座右铭
2019/08/09 职场文书
Python入门之使用pandas分析excel数据
2021/05/12 Python
Nginx反向代理配置的全过程记录
2021/06/22 Servers