一行Python代码过滤标点符号等特殊字符


Posted in Python onAugust 12, 2019

很多时候我们需要过滤掉标点符号等特殊字符,网上虽然有一堆的方法,但是都没有找到一个非常满意的,有些过滤不了中文的标点符号,有些过滤不了英文的标点符号,有些过滤不全。

最后通过查看正则表达式文档,发现一个高效的办法,一行代码就能搞定:

def replace_all_blank(value):
  """
  去除value中的所有非字母内容,包括标点符号、空格、换行、下划线等
  :param value: 需要处理的内容
  :return: 返回处理后的内容
  """
  # \W 表示匹配非数字字母下划线
  result = re.sub('\W+', '', value).replace("_", '')
  print(result)
  return result

其中用到了 Python 的 re 模块, re 模块里面包含了所有的正则表达式的应用。代码里面有几个点:

\W

测试一下:

replace_all_blank("Powe, on;the 2333, 。哈哈 !!看看可以吗?一行代码就可以了!^_^")

输出结果:

Poweonthe2333哈哈看看可以吗一行代码就可以了

一行代码搞定!Perfect!

最后推荐大家官网 re 模块的正则表达式文档地址:

https://docs.python.org/zh-cn/3.6/library/re.html

知识点扩展:

python过滤中英文标点符号

import re
# 过滤不了\\ \ 中文()还有————
r1 = u'[a-zA-Z0-9'!"#$%&\'()*+,-./:;<=>?@,。?★、…【】《》?“”‘'![\\]^_`{|}~]+'#用户也可以在此进行自定义过滤字符
# 者中规则也过滤不完全
r2 = "[\s+\.\!\/_,$%^*(+\"\']+|[+——!,。?、~@#¥%……&*()]+"
# \\\可以过滤掉反向单杠和双杠,/可以过滤掉正向单杠和双杠,第一个中括号里放的是英文符号,第二个中括号里放的是中文符号,第二个中括号前不能少|,否则过滤不完全
r3 = "[.!//_,$&%^*()<>+\"'?@#-|:~{}]+|[——!\\\\,。=?、:“”‘'《》【】¥……()]+"
# 去掉括号和括号内的所有内容
r4 = "\\【.*?】+|\\《.*?》+|\\#.*?#+|[.!/_,$&%^*()<>+""'?@|:~{}#]+|[——!\\\,。=?、:“”‘'¥……()《》【】]"
text = "\崔芸,\\我爱=+你!【我//""们】~————结/婚'吧::!这.!!_#??()个‘'“”¥$主|意()不错......!"
print(re.sub(r1, , '', text))

总结

以上所述是小编给大家介绍的一行代码Python过滤标点符号等特殊字符,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!
如果你觉得本文对你有帮助,欢迎转载,烦请注明出处,谢谢!

Python 相关文章推荐
python使用multiprocessing模块实现带回调函数的异步调用方法
Apr 18 Python
windows下python安装pip图文教程
May 25 Python
Python参数解析模块sys、getopt、argparse使用与对比分析
Apr 02 Python
django富文本编辑器的实现示例
Apr 10 Python
python之拟合的实现
Jul 19 Python
Python实现微信机器人的方法
Sep 06 Python
tensorflow estimator 使用hook实现finetune方式
Jan 21 Python
利用Python制作动态排名图的实现代码
Apr 09 Python
Python基于pip实现离线打包过程详解
May 15 Python
python实现一次性封装多条sql语句(begin end)
Jun 06 Python
python3的pip路径在哪
Jun 23 Python
Python文件操作及内置函数flush原理解析
Oct 13 Python
一篇文章弄懂Python中的可迭代对象、迭代器和生成器
Aug 12 #Python
Django认证系统实现的web页面实现代码
Aug 12 #Python
django 自定义过滤器(filter)处理较为复杂的变量方法
Aug 12 #Python
django-filter和普通查询的例子
Aug 12 #Python
利用python实现汉字转拼音的2种方法
Aug 12 #Python
python面向对象 反射原理解析
Aug 12 #Python
Python中正反斜杠(‘/’和‘\’)的意义与用法
Aug 12 #Python
You might like
使用adodb lite解决问题
2006/12/31 PHP
ThinkPHP3.1新特性之Action参数绑定
2014/06/19 PHP
PHP文件下载实例代码浅析
2016/08/17 PHP
php中照片旋转 (orientation) 问题的正确处理
2017/02/16 PHP
如何直接访问php实例对象中的private属性详解
2017/10/12 PHP
php时间戳转换代码详解
2019/08/04 PHP
js 纯数字不重复排列的另类方法
2010/07/17 Javascript
JavaScript类和继承 this属性使用说明
2010/09/03 Javascript
jquery写个checkbox——类似邮箱全选功能
2013/03/19 Javascript
Jquery绑定事件(bind和live的区别介绍)
2013/08/23 Javascript
浅析jquery的js图表组件highcharts
2014/03/06 Javascript
javascript实现表单提交后,提交按钮不可用的方法
2015/04/18 Javascript
JS回调函数基本定义与用法实例分析
2017/05/24 Javascript
JS实现图片预览的两种方式
2017/06/27 Javascript
Javascript刷新页面的实例
2017/09/23 Javascript
轻松理解vue的双向数据绑定问题
2017/10/30 Javascript
产制造追溯系统之通过微信小程序实现移动端报表平台
2019/06/03 Javascript
写给新手同学的vuex快速上手指北小结
2020/04/14 Javascript
浅析Python中的多进程与多线程的使用
2015/04/07 Python
全面了解Python环境配置及项目建立
2016/06/30 Python
Python 序列的方法总结
2016/10/18 Python
Django 实现图片上传和显示过程详解
2019/07/18 Python
Python 导入文件过程图解
2019/10/15 Python
丝芙兰墨西哥官网:Sephora墨西哥
2020/05/30 全球购物
抽象方法、抽象类怎样声明
2014/10/25 面试题
北京振戎融通Java面试题
2015/09/03 面试题
平安校园建设方案
2014/05/02 职场文书
缅怀先烈演讲稿
2014/09/03 职场文书
股东授权委托书范本
2014/09/13 职场文书
基层干部群众路线教育实践活动个人对照检查材料
2014/09/23 职场文书
工程部文员岗位职责
2015/02/04 职场文书
银行自荐信范文
2015/03/25 职场文书
2016先进集体事迹材料范文
2016/02/25 职场文书
Vue如何清空对象
2022/03/03 Vue.js
90后经典动画片排行:《数码宝贝》第二,《小鲤鱼历险记》在榜
2022/03/18 日漫
德生2P3收音机开箱评测
2022/04/30 无线电