一行Python代码过滤标点符号等特殊字符


Posted in Python onAugust 12, 2019

很多时候我们需要过滤掉标点符号等特殊字符,网上虽然有一堆的方法,但是都没有找到一个非常满意的,有些过滤不了中文的标点符号,有些过滤不了英文的标点符号,有些过滤不全。

最后通过查看正则表达式文档,发现一个高效的办法,一行代码就能搞定:

def replace_all_blank(value):
  """
  去除value中的所有非字母内容,包括标点符号、空格、换行、下划线等
  :param value: 需要处理的内容
  :return: 返回处理后的内容
  """
  # \W 表示匹配非数字字母下划线
  result = re.sub('\W+', '', value).replace("_", '')
  print(result)
  return result

其中用到了 Python 的 re 模块, re 模块里面包含了所有的正则表达式的应用。代码里面有几个点:

\W

测试一下:

replace_all_blank("Powe, on;the 2333, 。哈哈 !!看看可以吗?一行代码就可以了!^_^")

输出结果:

Poweonthe2333哈哈看看可以吗一行代码就可以了

一行代码搞定!Perfect!

最后推荐大家官网 re 模块的正则表达式文档地址:

https://docs.python.org/zh-cn/3.6/library/re.html

知识点扩展:

python过滤中英文标点符号

import re
# 过滤不了\\ \ 中文()还有————
r1 = u'[a-zA-Z0-9'!"#$%&\'()*+,-./:;<=>?@,。?★、…【】《》?“”‘'![\\]^_`{|}~]+'#用户也可以在此进行自定义过滤字符
# 者中规则也过滤不完全
r2 = "[\s+\.\!\/_,$%^*(+\"\']+|[+——!,。?、~@#¥%……&*()]+"
# \\\可以过滤掉反向单杠和双杠,/可以过滤掉正向单杠和双杠,第一个中括号里放的是英文符号,第二个中括号里放的是中文符号,第二个中括号前不能少|,否则过滤不完全
r3 = "[.!//_,$&%^*()<>+\"'?@#-|:~{}]+|[——!\\\\,。=?、:“”‘'《》【】¥……()]+"
# 去掉括号和括号内的所有内容
r4 = "\\【.*?】+|\\《.*?》+|\\#.*?#+|[.!/_,$&%^*()<>+""'?@|:~{}#]+|[——!\\\,。=?、:“”‘'¥……()《》【】]"
text = "\崔芸,\\我爱=+你!【我//""们】~————结/婚'吧::!这.!!_#??()个‘'“”¥$主|意()不错......!"
print(re.sub(r1, , '', text))

总结

以上所述是小编给大家介绍的一行代码Python过滤标点符号等特殊字符,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!
如果你觉得本文对你有帮助,欢迎转载,烦请注明出处,谢谢!

Python 相关文章推荐
Python处理XML格式数据的方法详解
Mar 21 Python
用Python设计一个经典小游戏
May 15 Python
OpenCV2从摄像头获取帧并写入视频文件的方法
Aug 03 Python
程序员写Python时的5个坏习惯,你有几条?
Nov 26 Python
django Admin文档生成器使用详解
Jul 22 Python
Django发送邮件和itsdangerous模块的配合使用解析
Aug 10 Python
ubuntu上安装python的实例方法
Sep 30 Python
python通过opencv实现图片裁剪原理解析
Jan 19 Python
Python reduce函数作用及实例解析
May 08 Python
如何理解python中数字列表
May 29 Python
matplotlib交互式数据光标实现(mplcursors)
Jan 13 Python
Python中字符串对象语法分享
Feb 24 Python
一篇文章弄懂Python中的可迭代对象、迭代器和生成器
Aug 12 #Python
Django认证系统实现的web页面实现代码
Aug 12 #Python
django 自定义过滤器(filter)处理较为复杂的变量方法
Aug 12 #Python
django-filter和普通查询的例子
Aug 12 #Python
利用python实现汉字转拼音的2种方法
Aug 12 #Python
python面向对象 反射原理解析
Aug 12 #Python
Python中正反斜杠(‘/’和‘\’)的意义与用法
Aug 12 #Python
You might like
PHP爆绝对路径方法收集整理
2012/09/17 PHP
PHP cdata 处理(详细介绍)
2013/07/05 PHP
PHP Curl出现403错误的解决办法
2014/05/29 PHP
Android AsyncTack 异步任务实例详解
2016/11/02 PHP
Flash对联广告的关闭按钮讨论
2007/01/30 Javascript
用js实现上传图片前的预览(TX的面试题)
2007/08/14 Javascript
将HTML的左右尖括号等转义成实体形式的两种实现方式
2014/05/04 Javascript
jQuery插件分享之分页插件jqPagination
2014/06/06 Javascript
IE8中动态创建script标签onload无效的解决方法
2014/12/22 Javascript
Vuejs入门教程之Vue生命周期,数据,手动挂载,指令,过滤器
2017/04/19 Javascript
js中字符型和数值型数字的互相转化方法(必看)
2017/04/25 Javascript
Angular2开发环境搭建教程之VS Code
2017/12/15 Javascript
详解Vue Elememt-UI构建管理后台
2018/02/27 Javascript
快速处理vue渲染前的显示问题
2018/03/05 Javascript
关于RxJS Subject的学习笔记
2018/12/05 Javascript
JavaScript中的惰性载入函数及优势
2020/02/18 Javascript
JavaScript代码实现简单计算器
2020/12/27 Javascript
[02:12]2015国际邀请赛 SHOWOPEN
2015/08/05 DOTA
在Python中操作列表之List.append()方法的使用
2015/05/20 Python
Python实现时钟显示效果思路详解
2018/04/11 Python
Django中使用Celery的方法示例
2018/11/29 Python
详解Python中正则匹配TAB及空格的小技巧
2019/07/26 Python
python中字典按键或键值排序的实现代码
2019/08/27 Python
Python aiohttp百万并发极限测试实例分析
2019/10/26 Python
python 计算方位角实例(根据两点的坐标计算)
2020/01/17 Python
Python3监控windows,linux系统的CPU、硬盘、内存使用率和各个端口的开启情况详细代码实例
2020/03/18 Python
python解释器安装教程的方法步骤
2020/07/02 Python
python批量生成条形码的示例
2020/10/10 Python
No module named ‘win32gui‘ 的解决方法(踩坑之旅)
2021/02/18 Python
英国领先的男装设计师服装购物网站:Mainline Menswear
2018/02/04 全球购物
欧洲顶级的童装奢侈品购物网站:Bambini Fashion(面向全球)
2018/04/24 全球购物
颇特女士:NET-A-PORTER(直邮中国)
2020/07/11 全球购物
旅游管理实习自我鉴定
2013/09/29 职场文书
井冈山红色之旅感想
2014/10/07 职场文书
2015年“我们的节日·中秋节”活动总结
2015/07/30 职场文书
演讲稿之开卷有益
2019/08/07 职场文书