python正则过滤字母、中文、数字及特殊字符方法详解


Posted in Python onFebruary 11, 2020

去除数字,特殊字符,只保留汉字

import re
 
s = '1123*#$ 中abc国'
str = re.sub('[a-zA-Z0-9'!"#$%&\'()*+,-./:;<=>?@,。?★、…【】《》?“”‘'![\\]^_`{|}~\s]+', "", s)
# 去除不可见字符
str = re.sub('[\001\002\003\004\005\006\007\x08\x09\x0a\x0b\x0c\x0d\x0e\x0f\x10\x11\x12\x13\x14\x15\x16\x17\x18\x19\x1a]+', '', x)
print(str)
# 结果为:中国

去除特殊字符,只保留汉子,字母、数字

import re
string = "123我123456abcdefgABCVDFF?/ ,。,.:;:''';'''[]{}()()《》"
print(string)
123我123456abcdefgABCVDFF?/ ,。,.:;:''';'''[]{}()()《》
sub_str = re.sub(u"([^\u4e00-\u9fa5\u0030-\u0039\u0041-\u005a\u0061-\u007a])","",string)
print(sub_str)
123我123456abcdefgABCVDFF

正则表达式说明

函数 说明
sub(pattern,repl,string) 把字符串中的所有匹配表达式pattern中的地方替换成repl
[^**] 表示不匹配此字符集中的任何一个字符
\u4e00-\u9fa5 汉字的unicode范围
\u0030-\u0039 数字的unicode范围
\u0041-\u005a 大写字母unicode范围
\u0061-\u007a 小写字母unicode范围
\uAC00-\uD7AF 韩文的unicode范围
\u3040-\u31FF 日文的unicode范围

更多关于python正则过滤字母、数字及特殊字符方法请查看下面相关链接

Python 相关文章推荐
python合并文本文件示例
Feb 07 Python
Python卸载模块的方法汇总
Jun 07 Python
Python的网络编程库Gevent的安装及使用技巧
Jun 24 Python
Python面向对象基础入门之编码细节与注意事项
Dec 11 Python
python ChainMap的使用和说明详解
Jun 11 Python
用scikit-learn和pandas学习线性回归的方法
Jun 21 Python
详解opencv中画圆circle函数和椭圆ellipse函数
Dec 27 Python
关于PyCharm安装后修改路径名称使其可重新打开的问题
Oct 20 Python
python爬取微博评论的实例讲解
Jan 15 Python
python 自动刷新网页的两种方法
Apr 20 Python
Python可视化学习之seaborn调色盘
Feb 24 Python
python中字符串String及其常见操作指南(方法、函数)
Apr 06 Python
python3正则模块re的使用方法详解
Feb 11 #Python
Python版中国省市经纬度
Feb 11 #Python
Python终端输出彩色字符方法详解
Feb 11 #Python
Python连接Oracle之环境配置、实例代码及报错解决方法详解
Feb 11 #Python
利用python中集合的唯一性实现去重
Feb 11 #Python
TensorFLow 变量命名空间实例
Feb 11 #Python
TensorFlow 输出checkpoint 中的变量名与变量值方式
Feb 11 #Python
You might like
php通过array_merge()函数合并两个数组的方法
2015/03/18 PHP
typecho插件编写教程(四):插件挂载
2015/05/28 PHP
Zend Framework动作助手Json用法实例分析
2016/03/05 PHP
利用switch语句进行多选一判断的实例代码
2016/11/14 PHP
javascript 操作文件 实现方法小结
2009/07/02 Javascript
动态加载jquery库的方法
2014/02/12 Javascript
z-blog SyntaxHighlighter 长代码无法换行解决办法(jquery)
2014/11/16 Javascript
javascript中clone对象详解
2014/12/03 Javascript
使用jquery 简单实现下拉菜单
2015/01/14 Javascript
JS实现鼠标滑过链接改变网页背景颜色的方法
2015/10/20 Javascript
JavaScript学习笔记之数组求和方法
2016/03/23 Javascript
Angular中$cacheFactory的作用和用法实例详解
2016/08/19 Javascript
vue+axios实现登录拦截的实例代码
2017/05/22 Javascript
JS沙箱模式实例分析
2017/09/04 Javascript
jQueryMobile之窗体长内容的缺陷与解决方法实例分析
2017/09/20 jQuery
微信小程序 按钮滑动的实现方法
2017/09/27 Javascript
vue脚手架及vue-router基本使用
2018/04/09 Javascript
vue中的适配px2rem示例代码
2018/11/19 Javascript
nodejs 使用http进行post或get请求的实例(携带cookie)
2019/01/03 NodeJs
VueX模块的具体使用(小白教程)
2020/06/05 Javascript
python获取文件扩展名的方法
2015/07/06 Python
python从内存地址上加载python对象过程详解
2020/01/08 Python
Python脚本去除文件的只读性操作
2020/03/05 Python
python退出循环的方法
2020/06/18 Python
Python 日期与时间转换的方法
2020/08/01 Python
Python unittest装饰器实现原理及代码
2020/09/08 Python
SHEIN香港:价格实惠的女性时尚服装
2018/08/14 全球购物
授权委托书怎么写
2014/04/03 职场文书
2015年元旦主持词开场白
2014/12/14 职场文书
2015年世界艾滋病日活动总结
2015/03/24 职场文书
2015年招生工作总结
2015/05/04 职场文书
工作调动申请报告
2015/05/18 职场文书
雷锋的观后感
2015/06/10 职场文书
2016年国庆节67周年活动总结
2016/04/01 职场文书
详解Mysql和Oracle之间的误区
2021/05/18 MySQL
在 HTML 页面中使用 React的场景分析
2022/01/18 Javascript