一行Python代码过滤标点符号等特殊字符


Posted in Python onAugust 12, 2019

很多时候我们需要过滤掉标点符号等特殊字符,网上虽然有一堆的方法,但是都没有找到一个非常满意的,有些过滤不了中文的标点符号,有些过滤不了英文的标点符号,有些过滤不全。

最后通过查看正则表达式文档,发现一个高效的办法,一行代码就能搞定:

def replace_all_blank(value):
  """
  去除value中的所有非字母内容,包括标点符号、空格、换行、下划线等
  :param value: 需要处理的内容
  :return: 返回处理后的内容
  """
  # \W 表示匹配非数字字母下划线
  result = re.sub('\W+', '', value).replace("_", '')
  print(result)
  return result

其中用到了 Python 的 re 模块, re 模块里面包含了所有的正则表达式的应用。代码里面有几个点:

\W

测试一下:

replace_all_blank("Powe, on;the 2333, 。哈哈 !!看看可以吗?一行代码就可以了!^_^")

输出结果:

Poweonthe2333哈哈看看可以吗一行代码就可以了

一行代码搞定!Perfect!

最后推荐大家官网 re 模块的正则表达式文档地址:

https://docs.python.org/zh-cn/3.6/library/re.html

知识点扩展:

python过滤中英文标点符号

import re
# 过滤不了\\ \ 中文()还有————
r1 = u'[a-zA-Z0-9'!"#$%&\'()*+,-./:;<=>?@,。?★、…【】《》?“”‘'![\\]^_`{|}~]+'#用户也可以在此进行自定义过滤字符
# 者中规则也过滤不完全
r2 = "[\s+\.\!\/_,$%^*(+\"\']+|[+——!,。?、~@#¥%……&*()]+"
# \\\可以过滤掉反向单杠和双杠,/可以过滤掉正向单杠和双杠,第一个中括号里放的是英文符号,第二个中括号里放的是中文符号,第二个中括号前不能少|,否则过滤不完全
r3 = "[.!//_,$&%^*()<>+\"'?@#-|:~{}]+|[——!\\\\,。=?、:“”‘'《》【】¥……()]+"
# 去掉括号和括号内的所有内容
r4 = "\\【.*?】+|\\《.*?》+|\\#.*?#+|[.!/_,$&%^*()<>+""'?@|:~{}#]+|[——!\\\,。=?、:“”‘'¥……()《》【】]"
text = "\崔芸,\\我爱=+你!【我//""们】~————结/婚'吧::!这.!!_#??()个‘'“”¥$主|意()不错......!"
print(re.sub(r1, , '', text))

总结

以上所述是小编给大家介绍的一行代码Python过滤标点符号等特殊字符,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!
如果你觉得本文对你有帮助,欢迎转载,烦请注明出处,谢谢!

Python 相关文章推荐
python装饰器使用方法实例
Nov 21 Python
Python使用scrapy采集数据时为每个请求随机分配user-agent的方法
Apr 08 Python
详解Python中__str__和__repr__方法的区别
Apr 17 Python
介绍Python中的__future__模块
Apr 27 Python
Python实现统计代码行的方法分析
Jul 12 Python
python遍历小写英文字母的方法
Jan 02 Python
Python判断两个文件是否相同与两个文本进行相同项筛选的方法
Mar 01 Python
Django对models里的objects的使用详解
Aug 17 Python
Python中filter与lambda的结合使用详解
Dec 24 Python
Opencv python 图片生成视频的方法示例
Nov 18 Python
利用Python判断你的密码难度等级
Jun 02 Python
python单元测试之pytest的使用
Jun 07 Python
一篇文章弄懂Python中的可迭代对象、迭代器和生成器
Aug 12 #Python
Django认证系统实现的web页面实现代码
Aug 12 #Python
django 自定义过滤器(filter)处理较为复杂的变量方法
Aug 12 #Python
django-filter和普通查询的例子
Aug 12 #Python
利用python实现汉字转拼音的2种方法
Aug 12 #Python
python面向对象 反射原理解析
Aug 12 #Python
Python中正反斜杠(‘/’和‘\’)的意义与用法
Aug 12 #Python
You might like
php将时间差转换为字符串提示
2011/09/07 PHP
如何使用jQuery+PHP+MySQL来实现一个在线测试项目
2015/04/26 PHP
分享PHP计算两个日期相差天数的代码
2015/12/23 PHP
php批量删除操作代码分享
2017/02/26 PHP
thinkPHP框架整合tcpdf插件操作示例
2018/08/07 PHP
php反序列化长度变化尾部字符串逃逸(0CTF-2016-piapiapia)
2020/02/15 PHP
JavaScript的Cookies
2008/01/16 Javascript
javascript addBookmark 加入收藏 多浏览器兼容
2009/08/15 Javascript
Javascript中的isNaN函数使用说明
2011/11/10 Javascript
Js base64 加密解密介绍
2013/10/11 Javascript
javascript检测flash插件是否被禁用的方法
2016/01/14 Javascript
Bootstrap 模态对话框只加载一次 remote 数据的完美解决办法
2017/07/09 Javascript
详解前端路由实现与react-router使用姿势
2017/08/07 Javascript
详解wow.js中各种特效对应的类名
2017/09/13 Javascript
vue.js过滤器+ajax实现事件监听及后台php数据交互实例
2018/05/22 Javascript
JavaScript中的各种宽高属性的实现
2020/05/08 Javascript
在NodeJs中使用node-schedule增加定时器任务的方法
2020/06/08 NodeJs
[01:01:24]DOTA2上海特级锦标赛A组败者赛 EHOME VS CDEC第三局
2016/02/25 DOTA
分享一个常用的Python模拟登陆类
2015/03/29 Python
python如何派生内置不可变类型并修改实例化行为
2018/03/21 Python
python破解zip加密文件的方法
2018/05/31 Python
python保存文件方法小结
2018/07/27 Python
python程序控制NAO机器人行走
2019/04/29 Python
django数据库自动重连的方法实例
2019/07/21 Python
Tensorflow实现部分参数梯度更新操作
2020/01/23 Python
python烟花效果的代码实例
2020/02/25 Python
CSS3样式linear-gradient的使用实例
2017/01/16 HTML / CSS
临床医学系毕业生推荐信
2013/11/09 职场文书
理工大学毕业生自荐信范文
2014/02/22 职场文书
跟单业务员岗位职责
2014/03/08 职场文书
化工专业自荐书
2014/06/16 职场文书
纪念九一八事变演讲稿:青少年应树立远大理想
2014/09/14 职场文书
2014年向国旗敬礼活动总结
2014/09/27 职场文书
质量负责人岗位职责
2015/02/15 职场文书
centos8安装nginx1.9.1的详细过程
2021/08/02 Servers
Python中的pprint模块
2021/11/27 Python