一行Python代码过滤标点符号等特殊字符


Posted in Python onAugust 12, 2019

很多时候我们需要过滤掉标点符号等特殊字符,网上虽然有一堆的方法,但是都没有找到一个非常满意的,有些过滤不了中文的标点符号,有些过滤不了英文的标点符号,有些过滤不全。

最后通过查看正则表达式文档,发现一个高效的办法,一行代码就能搞定:

def replace_all_blank(value):
  """
  去除value中的所有非字母内容,包括标点符号、空格、换行、下划线等
  :param value: 需要处理的内容
  :return: 返回处理后的内容
  """
  # \W 表示匹配非数字字母下划线
  result = re.sub('\W+', '', value).replace("_", '')
  print(result)
  return result

其中用到了 Python 的 re 模块, re 模块里面包含了所有的正则表达式的应用。代码里面有几个点:

\W

测试一下:

replace_all_blank("Powe, on;the 2333, 。哈哈 !!看看可以吗?一行代码就可以了!^_^")

输出结果:

Poweonthe2333哈哈看看可以吗一行代码就可以了

一行代码搞定!Perfect!

最后推荐大家官网 re 模块的正则表达式文档地址:

https://docs.python.org/zh-cn/3.6/library/re.html

知识点扩展:

python过滤中英文标点符号

import re
# 过滤不了\\ \ 中文()还有————
r1 = u'[a-zA-Z0-9'!"#$%&\'()*+,-./:;<=>?@,。?★、…【】《》?“”‘'![\\]^_`{|}~]+'#用户也可以在此进行自定义过滤字符
# 者中规则也过滤不完全
r2 = "[\s+\.\!\/_,$%^*(+\"\']+|[+——!,。?、~@#¥%……&*()]+"
# \\\可以过滤掉反向单杠和双杠,/可以过滤掉正向单杠和双杠,第一个中括号里放的是英文符号,第二个中括号里放的是中文符号,第二个中括号前不能少|,否则过滤不完全
r3 = "[.!//_,$&%^*()<>+\"'?@#-|:~{}]+|[——!\\\\,。=?、:“”‘'《》【】¥……()]+"
# 去掉括号和括号内的所有内容
r4 = "\\【.*?】+|\\《.*?》+|\\#.*?#+|[.!/_,$&%^*()<>+""'?@|:~{}#]+|[——!\\\,。=?、:“”‘'¥……()《》【】]"
text = "\崔芸,\\我爱=+你!【我//""们】~————结/婚'吧::!这.!!_#??()个‘'“”¥$主|意()不错......!"
print(re.sub(r1, , '', text))

总结

以上所述是小编给大家介绍的一行代码Python过滤标点符号等特殊字符,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!
如果你觉得本文对你有帮助,欢迎转载,烦请注明出处,谢谢!

Python 相关文章推荐
python开发的小球完全弹性碰撞游戏代码
Oct 15 Python
python读取浮点数和读取文本文件示例
May 06 Python
Python实现快速傅里叶变换的方法(FFT)
Jul 21 Python
Python如何使用Gitlab API实现批量的合并分支
Nov 27 Python
flask框架json数据的拿取和返回操作示例
Nov 28 Python
python实现输入的数据在地图上生成热力图效果
Dec 06 Python
Python MOCK SERVER moco模拟接口测试过程解析
Apr 13 Python
解决Jupyter notebook中.py与.ipynb文件的import问题
Apr 21 Python
Keras 加载已经训练好的模型进行预测操作
Jun 17 Python
浅谈python处理json和redis hash的坑
Jul 16 Python
如何利用pycharm进行代码更新比较
Nov 04 Python
python爬虫中url管理器去重操作实例
Nov 30 Python
一篇文章弄懂Python中的可迭代对象、迭代器和生成器
Aug 12 #Python
Django认证系统实现的web页面实现代码
Aug 12 #Python
django 自定义过滤器(filter)处理较为复杂的变量方法
Aug 12 #Python
django-filter和普通查询的例子
Aug 12 #Python
利用python实现汉字转拼音的2种方法
Aug 12 #Python
python面向对象 反射原理解析
Aug 12 #Python
Python中正反斜杠(‘/’和‘\’)的意义与用法
Aug 12 #Python
You might like
一些星际专用术语解释
2020/03/04 星际争霸
PHP基础学习小结
2011/04/17 PHP
对text数据类型不支持代码页转换 从: 1252 到: 936
2011/04/23 PHP
yii分页组件用法实例分析
2015/12/28 PHP
为何说PHP引用是个坑,要慎用
2018/04/02 PHP
thinkPHP框架通过Redis实现增删改查操作的方法详解
2019/05/13 PHP
ext 列表页面关于多行查询的办法
2010/03/25 Javascript
jQuery EasyUI 中文API Layout(Tabs)
2010/04/27 Javascript
js常用代码段整理
2011/11/30 Javascript
jquery阻止冒泡事件使用模拟事件
2013/09/06 Javascript
教你如何使用firebug调试功能了解javascript闭包和this
2015/03/04 Javascript
JavaScript前端开发之实现二进制读写操作
2015/11/04 Javascript
Bootstrap中的Dropdown下拉菜单更改为悬停(hover)触发
2016/08/31 Javascript
Bootstrap基本布局实现方法详解
2016/11/25 Javascript
Express + Node.js实现登录拦截器的实例代码
2017/07/01 Javascript
Javascript网页抢红包外挂实现分享
2018/01/11 Javascript
Vue使用json-server进行后端数据模拟功能
2018/04/17 Javascript
vue如何在自定义组件中使用v-model
2018/05/14 Javascript
js取0-9随机取4个数不重复的数字代码实例
2019/03/27 Javascript
vue 如何使用递归组件
2020/10/23 Javascript
Python3爬虫之urllib携带cookie爬取网页的方法
2018/12/28 Python
对PyQt5中树结构的实现方法详解
2019/06/17 Python
python搜索包的路径的实现方法
2019/07/19 Python
keras实现多GPU或指定GPU的使用介绍
2020/06/17 Python
浅谈pandas dataframe对除数是零的处理
2020/07/20 Python
教你使用Sublime text3搭建Python开发环境及常用插件安装另分享Sublime text3最新激活注册码
2020/11/12 Python
moosejaw旗下的户外商品促销网站:Mountain Steals
2017/02/27 全球购物
FOREO斐珞尔官方旗舰店:LUNA露娜洁面仪
2018/03/11 全球购物
如何手工释放资源
2013/12/15 面试题
给领导的致歉信范文
2014/01/13 职场文书
篮球比赛策划方案
2014/06/05 职场文书
农村门前三包责任书
2014/07/25 职场文书
大学拉赞助协议书范文
2014/09/26 职场文书
教师自我剖析材料范文
2014/09/30 职场文书
小学毕业教师寄语
2019/06/21 职场文书
Windows Server 2019 安装DHCP服务及相关配置
2022/04/28 Servers