一行Python代码过滤标点符号等特殊字符


Posted in Python onAugust 12, 2019

很多时候我们需要过滤掉标点符号等特殊字符,网上虽然有一堆的方法,但是都没有找到一个非常满意的,有些过滤不了中文的标点符号,有些过滤不了英文的标点符号,有些过滤不全。

最后通过查看正则表达式文档,发现一个高效的办法,一行代码就能搞定:

def replace_all_blank(value):
  """
  去除value中的所有非字母内容,包括标点符号、空格、换行、下划线等
  :param value: 需要处理的内容
  :return: 返回处理后的内容
  """
  # \W 表示匹配非数字字母下划线
  result = re.sub('\W+', '', value).replace("_", '')
  print(result)
  return result

其中用到了 Python 的 re 模块, re 模块里面包含了所有的正则表达式的应用。代码里面有几个点:

\W

测试一下:

replace_all_blank("Powe, on;the 2333, 。哈哈 !!看看可以吗?一行代码就可以了!^_^")

输出结果:

Poweonthe2333哈哈看看可以吗一行代码就可以了

一行代码搞定!Perfect!

最后推荐大家官网 re 模块的正则表达式文档地址:

https://docs.python.org/zh-cn/3.6/library/re.html

知识点扩展:

python过滤中英文标点符号

import re
# 过滤不了\\ \ 中文()还有————
r1 = u'[a-zA-Z0-9'!"#$%&\'()*+,-./:;<=>?@,。?★、…【】《》?“”‘'![\\]^_`{|}~]+'#用户也可以在此进行自定义过滤字符
# 者中规则也过滤不完全
r2 = "[\s+\.\!\/_,$%^*(+\"\']+|[+——!,。?、~@#¥%……&*()]+"
# \\\可以过滤掉反向单杠和双杠,/可以过滤掉正向单杠和双杠,第一个中括号里放的是英文符号,第二个中括号里放的是中文符号,第二个中括号前不能少|,否则过滤不完全
r3 = "[.!//_,$&%^*()<>+\"'?@#-|:~{}]+|[——!\\\\,。=?、:“”‘'《》【】¥……()]+"
# 去掉括号和括号内的所有内容
r4 = "\\【.*?】+|\\《.*?》+|\\#.*?#+|[.!/_,$&%^*()<>+""'?@|:~{}#]+|[——!\\\,。=?、:“”‘'¥……()《》【】]"
text = "\崔芸,\\我爱=+你!【我//""们】~————结/婚'吧::!这.!!_#??()个‘'“”¥$主|意()不错......!"
print(re.sub(r1, , '', text))

总结

以上所述是小编给大家介绍的一行代码Python过滤标点符号等特殊字符,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!
如果你觉得本文对你有帮助,欢迎转载,烦请注明出处,谢谢!

Python 相关文章推荐
跟老齐学Python之开始真正编程
Sep 12 Python
深入源码解析Python中的对象与类型
Dec 11 Python
python使用logging模块发送邮件代码示例
Jan 18 Python
python logging日志模块以及多进程日志详解
Apr 18 Python
用python的turtle模块实现给女票画个小心心
Nov 23 Python
基于python的列表list和集合set操作
Nov 24 Python
Python requests模块session代码实例
Apr 14 Python
TensorFLow 数学运算的示例代码
Apr 21 Python
python的help函数如何使用
Jun 11 Python
Django serializer优化类视图的实现示例
Jul 16 Python
Selenium+BeautifulSoup+json获取Script标签内的json数据
Dec 07 Python
M1芯片安装python3.9.1的实现
Feb 02 Python
一篇文章弄懂Python中的可迭代对象、迭代器和生成器
Aug 12 #Python
Django认证系统实现的web页面实现代码
Aug 12 #Python
django 自定义过滤器(filter)处理较为复杂的变量方法
Aug 12 #Python
django-filter和普通查询的例子
Aug 12 #Python
利用python实现汉字转拼音的2种方法
Aug 12 #Python
python面向对象 反射原理解析
Aug 12 #Python
Python中正反斜杠(‘/’和‘\’)的意义与用法
Aug 12 #Python
You might like
表格展示无限级分类(PHP版)
2012/08/21 PHP
解析PHP工厂模式的好处
2013/06/18 PHP
慎用preg_replace危险的/e修饰符(一句话后门常用)
2013/06/19 PHP
PHP实现无限极分类图文教程
2014/11/25 PHP
smarty内置函数capture用法分析
2015/01/22 PHP
简单PHP会话(session)说明介绍
2016/08/21 PHP
javascript或asp实现的判断身份证号码是否正确两种验证方法
2009/11/26 Javascript
JS基础之undefined与null的区别分析
2011/08/08 Javascript
关于textarea提交的内容无法换行的解决办法
2013/04/09 Javascript
js监听键盘事件示例代码
2013/07/26 Javascript
分析了一下JQuery中的extend方法实现原理
2015/02/27 Javascript
理解javascript异步编程
2016/01/27 Javascript
简单实现JS倒计时效果
2016/12/23 Javascript
js实现简易垂直滚动条
2017/02/22 Javascript
JS设置随机出现2个数字的实例代码
2017/07/19 Javascript
基于JavaScript实现微信抢红包功能
2017/07/20 Javascript
javascript实现数字配对游戏的实例讲解
2017/12/14 Javascript
javascriptvoid(0)含义以及与&quot;#&quot;的区别讲解
2019/01/19 Javascript
微信小程序如何获取群聊的openGid以及名称详解
2019/07/17 Javascript
微信小程序用户授权弹窗 拒绝时引导用户重新授权实现
2019/07/29 Javascript
js实现表单项的全选、反选及删除操作示例
2020/06/05 Javascript
js实现翻牌小游戏
2020/07/31 Javascript
Python 获取新浪微博的最新公共微博实例分享
2014/07/03 Python
解析Python中的异常处理
2015/04/28 Python
Python实现监控键盘鼠标操作示例【基于pyHook与pythoncom模块】
2018/09/04 Python
python用pandas数据加载、存储与文件格式的实例
2018/12/07 Python
python实现图片九宫格分割
2021/03/07 Python
如何完美的建立一个python项目
2020/10/09 Python
用python写PDF转换器的实现
2020/10/29 Python
Python常用断言函数实例汇总
2020/11/30 Python
迅雷Cued工作心得体会
2014/01/27 职场文书
大学生党课心得体会
2016/01/07 职场文书
为什么你写的height:100%不起作用
2021/05/10 HTML / CSS
MySQL 分组查询的优化方法
2021/05/12 MySQL
MySQL实现配置主从复制项目实践
2022/03/31 MySQL
浅析Python OpenCV三种滤镜效果
2022/04/11 Python