python正则过滤字母、中文、数字及特殊字符方法详解


Posted in Python onFebruary 11, 2020

去除数字,特殊字符,只保留汉字

import re
 
s = '1123*#$ 中abc国'
str = re.sub('[a-zA-Z0-9'!"#$%&\'()*+,-./:;<=>?@,。?★、…【】《》?“”‘'![\\]^_`{|}~\s]+', "", s)
# 去除不可见字符
str = re.sub('[\001\002\003\004\005\006\007\x08\x09\x0a\x0b\x0c\x0d\x0e\x0f\x10\x11\x12\x13\x14\x15\x16\x17\x18\x19\x1a]+', '', x)
print(str)
# 结果为:中国

去除特殊字符,只保留汉子,字母、数字

import re
string = "123我123456abcdefgABCVDFF?/ ,。,.:;:''';'''[]{}()()《》"
print(string)
123我123456abcdefgABCVDFF?/ ,。,.:;:''';'''[]{}()()《》
sub_str = re.sub(u"([^\u4e00-\u9fa5\u0030-\u0039\u0041-\u005a\u0061-\u007a])","",string)
print(sub_str)
123我123456abcdefgABCVDFF

正则表达式说明

函数 说明
sub(pattern,repl,string) 把字符串中的所有匹配表达式pattern中的地方替换成repl
[^**] 表示不匹配此字符集中的任何一个字符
\u4e00-\u9fa5 汉字的unicode范围
\u0030-\u0039 数字的unicode范围
\u0041-\u005a 大写字母unicode范围
\u0061-\u007a 小写字母unicode范围
\uAC00-\uD7AF 韩文的unicode范围
\u3040-\u31FF 日文的unicode范围

更多关于python正则过滤字母、数字及特殊字符方法请查看下面相关链接

Python 相关文章推荐
Python 字典(Dictionary)操作详解
Mar 11 Python
python抓取百度首页的方法
May 19 Python
Python查询阿里巴巴关键字排名的方法
Jul 08 Python
python fabric实现远程部署
Jan 05 Python
Python正则表达式教程之一:基础篇
Mar 02 Python
Python迭代器与生成器用法实例分析
Jul 09 Python
Python实现简单石头剪刀布游戏
Jan 20 Python
Python3.7 新特性之dataclass装饰器
May 27 Python
Django CSRF跨站请求伪造防护过程解析
Jul 31 Python
django商品分类及商品数据建模实例详解
Jan 03 Python
Python日志logging模块功能与用法详解
Apr 09 Python
python使用openpyxl库读写Excel表格的方法(增删改查操作)
May 02 Python
python3正则模块re的使用方法详解
Feb 11 #Python
Python版中国省市经纬度
Feb 11 #Python
Python终端输出彩色字符方法详解
Feb 11 #Python
Python连接Oracle之环境配置、实例代码及报错解决方法详解
Feb 11 #Python
利用python中集合的唯一性实现去重
Feb 11 #Python
TensorFLow 变量命名空间实例
Feb 11 #Python
TensorFlow 输出checkpoint 中的变量名与变量值方式
Feb 11 #Python
You might like
PHP memcache扩展的三种安装方法
2009/04/26 PHP
PHP中usort在值相同时改变原始位置问题的解决方法
2011/11/27 PHP
php jq jquery getJSON跨域提交数据完整版
2013/09/13 PHP
PHP Streams(流)详细介绍及使用
2015/05/12 PHP
浅析PHP类的反射来实现依赖注入过程
2018/02/06 PHP
script的async属性以非阻塞的模式加载脚本
2013/01/15 Javascript
jQuery对Select的操作大集合(收藏)
2013/12/28 Javascript
javascript表单验证大全
2015/08/12 Javascript
利用jQuery中的ajax分页实现代码
2016/02/25 Javascript
JavaScript驾驭网页-CSS与DOM
2016/03/24 Javascript
js弹出框、对话框、提示框、弹窗实现方法总结(推荐)
2016/05/31 Javascript
JS中的数组转变成JSON格式字符串的方法
2017/05/09 Javascript
angular2 NgModel模块的具体使用方法
2019/04/10 Javascript
小程序关于请求同步的总结
2019/05/05 Javascript
Vue formData实现图片上传
2019/08/20 Javascript
关于vue表单提交防双/多击的例子
2019/10/31 Javascript
Vue在H5 项目中使用融云进行实时个人单聊通讯
2020/12/14 Vue.js
[02:12]2015国际邀请赛 SHOWOPEN
2015/08/05 DOTA
Python基本语法经典教程
2016/03/11 Python
Python全局变量用法实例分析
2016/07/19 Python
python装饰器常见使用方法分析
2019/06/26 Python
python对文件的操作方法汇总
2020/02/28 Python
完美解决pyinstaller打包报错找不到依赖pypiwin32或pywin32-ctypes的错误
2020/04/01 Python
Python 通过爬虫实现GitHub网页的模拟登录的示例代码
2020/08/17 Python
俄罗斯和世界各地的酒店预订:Hotels.com俄罗斯
2016/08/19 全球购物
荷兰DOD药房中文官网:DeOnlineDrogist
2020/12/27 全球购物
命名空间(namespace)和程序集(Assembly)有什么区别
2015/09/25 面试题
毕业生个人的求职信范文
2013/12/03 职场文书
医院学雷锋活动策划方案
2014/02/15 职场文书
市场营销工作计划书
2014/05/06 职场文书
统计专业自荐书
2014/07/06 职场文书
商场促销活动总结
2014/07/10 职场文书
民主评议政风行风整改方案
2014/09/17 职场文书
安全月宣传标语
2014/10/07 职场文书
学术研讨会欢迎词
2015/01/26 职场文书
聊聊golang中多个defer的执行顺序
2021/05/08 Golang