python正则过滤字母、中文、数字及特殊字符方法详解


Posted in Python onFebruary 11, 2020

去除数字,特殊字符,只保留汉字

import re
 
s = '1123*#$ 中abc国'
str = re.sub('[a-zA-Z0-9'!"#$%&\'()*+,-./:;<=>?@,。?★、…【】《》?“”‘'![\\]^_`{|}~\s]+', "", s)
# 去除不可见字符
str = re.sub('[\001\002\003\004\005\006\007\x08\x09\x0a\x0b\x0c\x0d\x0e\x0f\x10\x11\x12\x13\x14\x15\x16\x17\x18\x19\x1a]+', '', x)
print(str)
# 结果为:中国

去除特殊字符,只保留汉子,字母、数字

import re
string = "123我123456abcdefgABCVDFF?/ ,。,.:;:''';'''[]{}()()《》"
print(string)
123我123456abcdefgABCVDFF?/ ,。,.:;:''';'''[]{}()()《》
sub_str = re.sub(u"([^\u4e00-\u9fa5\u0030-\u0039\u0041-\u005a\u0061-\u007a])","",string)
print(sub_str)
123我123456abcdefgABCVDFF

正则表达式说明

函数 说明
sub(pattern,repl,string) 把字符串中的所有匹配表达式pattern中的地方替换成repl
[^**] 表示不匹配此字符集中的任何一个字符
\u4e00-\u9fa5 汉字的unicode范围
\u0030-\u0039 数字的unicode范围
\u0041-\u005a 大写字母unicode范围
\u0061-\u007a 小写字母unicode范围
\uAC00-\uD7AF 韩文的unicode范围
\u3040-\u31FF 日文的unicode范围

更多关于python正则过滤字母、数字及特殊字符方法请查看下面相关链接

Python 相关文章推荐
Python的组合模式与责任链模式编程示例
Feb 02 Python
Python实现二维有序数组查找的方法
Apr 27 Python
Python字典简介以及用法详解
Nov 15 Python
Android 兼容性问题:java.lang.UnsupportedOperationException解决办法
Mar 19 Python
python记录程序运行时间的三种方法
Jul 14 Python
Python 闭包的使用方法
Sep 07 Python
详解Python最长公共子串和最长公共子序列的实现
Jul 07 Python
Python基于滑动平均思想实现缺失数据填充的方法
Feb 21 Python
Python re 模块findall() 函数返回值展现方式解析
Aug 09 Python
使用 Python 在京东上抢口罩的思路详解
Feb 27 Python
使用python检查yaml配置文件是否符合要求
Apr 09 Python
Python类的继承super相关原理解析
Oct 22 Python
python3正则模块re的使用方法详解
Feb 11 #Python
Python版中国省市经纬度
Feb 11 #Python
Python终端输出彩色字符方法详解
Feb 11 #Python
Python连接Oracle之环境配置、实例代码及报错解决方法详解
Feb 11 #Python
利用python中集合的唯一性实现去重
Feb 11 #Python
TensorFLow 变量命名空间实例
Feb 11 #Python
TensorFlow 输出checkpoint 中的变量名与变量值方式
Feb 11 #Python
You might like
PHP的历史和优缺点
2006/10/09 PHP
Memcached常用命令以及使用说明详解
2013/06/27 PHP
部署PHP时的4个配置修改说明
2015/10/19 PHP
作为程序员必知的16个最佳PHP库
2015/12/09 PHP
php设计模式之委托模式
2016/02/13 PHP
Yii2 assets清除缓存的方法
2016/05/16 PHP
PHP连接MYSQL数据库的3种常用方法
2017/02/27 PHP
Yii2框架类自动加载机制实例分析
2018/05/02 PHP
做网页的一些技巧(续)
2007/02/01 Javascript
js常见表单应用技巧
2008/01/09 Javascript
JavaScript中的作用域链和闭包
2012/06/30 Javascript
使用js在页面中绘制表格核心代码
2013/09/16 Javascript
javascript内存管理详细解析
2013/11/11 Javascript
javascript判断css3动画结束 css3动画结束的回调函数
2015/03/10 Javascript
JavaScript 模块化编程(笔记)
2015/04/08 Javascript
基于javascript代码实现通过点击图片显示原图片
2015/11/29 Javascript
js 声明数组和向数组中添加对象变量的简单实例
2016/07/28 Javascript
AngularJS模块详解及示例代码
2016/08/17 Javascript
BootStrap 获得轮播中的索引和当前活动的焦点对象
2017/05/11 Javascript
[js高手之路]寄生组合式继承的优势详解
2017/08/28 Javascript
代码详解JS操作剪贴板
2018/02/11 Javascript
jQuery操作选中select下拉框的值代码实例
2020/02/07 jQuery
nodeJS与MySQL实现分页数据以及倒序数据
2020/06/05 NodeJs
vue打包静态资源后显示空白及static文件路径报错的解决
2020/09/02 Javascript
flask框架json数据的拿取和返回操作示例
2019/11/28 Python
解决使用python print打印函数返回值多一个None的问题
2020/04/09 Python
python mysql中in参数化说明
2020/06/05 Python
Selenium及python实现滚动操作多种方法
2020/07/21 Python
大学生职业生涯规划范文
2014/01/08 职场文书
校园歌咏比赛主持词
2014/03/18 职场文书
党的群众路线教育实践活动专题组织生活会发言材料
2014/10/17 职场文书
后勤工作个人总结
2015/02/28 职场文书
爱的教育观后感
2015/06/17 职场文书
神秘岛读书笔记
2015/07/01 职场文书
简短清晨问候语
2015/11/10 职场文书
SQL Server作业失败:无法确定所有者是否有服务器访问权限的解决方法
2021/06/30 SQL Server