一行Python代码过滤标点符号等特殊字符


Posted in Python onAugust 12, 2019

很多时候我们需要过滤掉标点符号等特殊字符,网上虽然有一堆的方法,但是都没有找到一个非常满意的,有些过滤不了中文的标点符号,有些过滤不了英文的标点符号,有些过滤不全。

最后通过查看正则表达式文档,发现一个高效的办法,一行代码就能搞定:

def replace_all_blank(value):
  """
  去除value中的所有非字母内容,包括标点符号、空格、换行、下划线等
  :param value: 需要处理的内容
  :return: 返回处理后的内容
  """
  # \W 表示匹配非数字字母下划线
  result = re.sub('\W+', '', value).replace("_", '')
  print(result)
  return result

其中用到了 Python 的 re 模块, re 模块里面包含了所有的正则表达式的应用。代码里面有几个点:

\W

测试一下:

replace_all_blank("Powe, on;the 2333, 。哈哈 !!看看可以吗?一行代码就可以了!^_^")

输出结果:

Poweonthe2333哈哈看看可以吗一行代码就可以了

一行代码搞定!Perfect!

最后推荐大家官网 re 模块的正则表达式文档地址:

https://docs.python.org/zh-cn/3.6/library/re.html

知识点扩展:

python过滤中英文标点符号

import re
# 过滤不了\\ \ 中文()还有————
r1 = u'[a-zA-Z0-9'!"#$%&\'()*+,-./:;<=>?@,。?★、…【】《》?“”‘'![\\]^_`{|}~]+'#用户也可以在此进行自定义过滤字符
# 者中规则也过滤不完全
r2 = "[\s+\.\!\/_,$%^*(+\"\']+|[+——!,。?、~@#¥%……&*()]+"
# \\\可以过滤掉反向单杠和双杠,/可以过滤掉正向单杠和双杠,第一个中括号里放的是英文符号,第二个中括号里放的是中文符号,第二个中括号前不能少|,否则过滤不完全
r3 = "[.!//_,$&%^*()<>+\"'?@#-|:~{}]+|[——!\\\\,。=?、:“”‘'《》【】¥……()]+"
# 去掉括号和括号内的所有内容
r4 = "\\【.*?】+|\\《.*?》+|\\#.*?#+|[.!/_,$&%^*()<>+""'?@|:~{}#]+|[——!\\\,。=?、:“”‘'¥……()《》【】]"
text = "\崔芸,\\我爱=+你!【我//""们】~————结/婚'吧::!这.!!_#??()个‘'“”¥$主|意()不错......!"
print(re.sub(r1, , '', text))

总结

以上所述是小编给大家介绍的一行代码Python过滤标点符号等特殊字符,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!
如果你觉得本文对你有帮助,欢迎转载,烦请注明出处,谢谢!

Python 相关文章推荐
Python中用Ctrl+C终止多线程程序的问题解决
Mar 30 Python
Python运维自动化之nginx配置文件对比操作示例
Aug 29 Python
python+splinter实现12306网站刷票并自动购票流程
Sep 25 Python
浅谈pyqt5中信号与槽的认识
Feb 17 Python
java判断三位数的实例讲解
Jun 10 Python
python算法与数据结构之冒泡排序实例详解
Jun 22 Python
python傅里叶变换FFT绘制频谱图
Jul 19 Python
详解在Python中以绝对路径或者相对路径导入文件的方法
Aug 30 Python
Python socket聊天脚本代码实例
Jan 02 Python
Python实现对adb命令封装
Mar 06 Python
python正则表达式 匹配反斜杠的操作方法
Aug 07 Python
C站最全Python标准库总结,你想要的都在这里
Jul 03 Python
一篇文章弄懂Python中的可迭代对象、迭代器和生成器
Aug 12 #Python
Django认证系统实现的web页面实现代码
Aug 12 #Python
django 自定义过滤器(filter)处理较为复杂的变量方法
Aug 12 #Python
django-filter和普通查询的例子
Aug 12 #Python
利用python实现汉字转拼音的2种方法
Aug 12 #Python
python面向对象 反射原理解析
Aug 12 #Python
Python中正反斜杠(‘/’和‘\’)的意义与用法
Aug 12 #Python
You might like
php 数组二分法查找函数代码
2010/02/16 PHP
php 生成短网址原理及代码
2014/01/23 PHP
PHP+Ajax验证码验证用户登录
2016/07/20 PHP
php 解决扫描二维码下载跳转问题
2017/01/13 PHP
PHP实现类似于C语言的文件读取及解析功能
2017/09/01 PHP
PHP实现打包下载文件的方法示例
2017/10/07 PHP
js转html实体的方法
2016/09/27 Javascript
概述BootStrap中role=&quot;form&quot;及role作用角色
2016/12/08 Javascript
jquery实现页面加载效果
2017/02/21 Javascript
Web技术实现移动监测的介绍
2017/09/18 Javascript
js定时器实现倒计时效果
2017/11/05 Javascript
Vue中v-for的数据分组实例
2018/03/07 Javascript
vue v-model动态生成详解
2018/06/30 Javascript
深入理解 Koa 框架中间件原理
2018/10/18 Javascript
详解vue-router 动态路由下子页面多页共活的解决方案
2019/12/22 Javascript
JS判断数组是否包含某元素实现方法汇总
2020/06/24 Javascript
详解JavaScript的this指向和绑定
2020/09/08 Javascript
[44:40]KG vs LGD 2019国际邀请赛小组赛 BO2 第一场 8.15
2019/08/16 DOTA
Python cookbook(数据结构与算法)对切片命名清除索引的方法
2018/03/13 Python
python调用API实现智能回复机器人
2018/04/10 Python
在python中只选取列表中某一纵列的方法
2018/11/28 Python
使用Windows批处理和WMI设置Python的环境变量方法
2019/08/14 Python
opencv3/C++图像像素操作详解
2019/12/10 Python
基于python实现文件加密功能
2020/01/06 Python
mac 上配置Pycharm连接远程服务器并实现使用远程服务器Python解释器的方法
2020/03/19 Python
python和pywin32实现窗口查找、遍历和点击的示例代码
2020/04/01 Python
HTML5之web workers_动力节点Java学院整理
2017/07/17 HTML / CSS
利用HTML5 Canvas制作键盘及鼠标动画的实例分享
2016/03/15 HTML / CSS
HTML5+Canvas+CSS3实现齐天大圣孙悟空腾云驾雾效果
2016/04/26 HTML / CSS
芝加哥牛排公司:Chicago Steak Company
2018/10/31 全球购物
我有一个char * 型指针正巧指向一些int 型变量, 我想跳过它们。 为什么如下的代码((int *)p)++; 不行?
2013/05/09 面试题
电气工程自动化求职信
2014/03/14 职场文书
婚前协议书标准版
2014/10/19 职场文书
酒店优秀员工推荐信
2015/03/24 职场文书
杨善洲观后感
2015/06/04 职场文书
2016年助残日旅游活动总结
2016/04/01 职场文书