一行Python代码过滤标点符号等特殊字符


Posted in Python onAugust 12, 2019

很多时候我们需要过滤掉标点符号等特殊字符,网上虽然有一堆的方法,但是都没有找到一个非常满意的,有些过滤不了中文的标点符号,有些过滤不了英文的标点符号,有些过滤不全。

最后通过查看正则表达式文档,发现一个高效的办法,一行代码就能搞定:

def replace_all_blank(value):
  """
  去除value中的所有非字母内容,包括标点符号、空格、换行、下划线等
  :param value: 需要处理的内容
  :return: 返回处理后的内容
  """
  # \W 表示匹配非数字字母下划线
  result = re.sub('\W+', '', value).replace("_", '')
  print(result)
  return result

其中用到了 Python 的 re 模块, re 模块里面包含了所有的正则表达式的应用。代码里面有几个点:

\W

测试一下:

replace_all_blank("Powe, on;the 2333, 。哈哈 !!看看可以吗?一行代码就可以了!^_^")

输出结果:

Poweonthe2333哈哈看看可以吗一行代码就可以了

一行代码搞定!Perfect!

最后推荐大家官网 re 模块的正则表达式文档地址:

https://docs.python.org/zh-cn/3.6/library/re.html

知识点扩展:

python过滤中英文标点符号

import re
# 过滤不了\\ \ 中文()还有————
r1 = u'[a-zA-Z0-9'!"#$%&\'()*+,-./:;<=>?@,。?★、…【】《》?“”‘'![\\]^_`{|}~]+'#用户也可以在此进行自定义过滤字符
# 者中规则也过滤不完全
r2 = "[\s+\.\!\/_,$%^*(+\"\']+|[+——!,。?、~@#¥%……&*()]+"
# \\\可以过滤掉反向单杠和双杠,/可以过滤掉正向单杠和双杠,第一个中括号里放的是英文符号,第二个中括号里放的是中文符号,第二个中括号前不能少|,否则过滤不完全
r3 = "[.!//_,$&%^*()<>+\"'?@#-|:~{}]+|[——!\\\\,。=?、:“”‘'《》【】¥……()]+"
# 去掉括号和括号内的所有内容
r4 = "\\【.*?】+|\\《.*?》+|\\#.*?#+|[.!/_,$&%^*()<>+""'?@|:~{}#]+|[——!\\\,。=?、:“”‘'¥……()《》【】]"
text = "\崔芸,\\我爱=+你!【我//""们】~————结/婚'吧::!这.!!_#??()个‘'“”¥$主|意()不错......!"
print(re.sub(r1, , '', text))

总结

以上所述是小编给大家介绍的一行代码Python过滤标点符号等特殊字符,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!
如果你觉得本文对你有帮助,欢迎转载,烦请注明出处,谢谢!

Python 相关文章推荐
Python中列表和元组的相关语句和方法讲解
Aug 20 Python
Python过滤列表用法实例分析
Apr 29 Python
你所不知道的Python奇技淫巧13招【实用】
Dec 14 Python
浅析使用Python操作文件
Jul 31 Python
Python编程之Re模块下的函数介绍
Oct 28 Python
Python cookbook(数据结构与算法)字典相关计算问题示例
Feb 18 Python
使用python实现语音文件的特征提取方法
Jan 09 Python
对Python3使运行暂停的方法详解
Feb 18 Python
使用pymysql查询数据库,把结果保存为列表并获取指定元素下标实例
May 15 Python
python实现按键精灵找色点击功能教程,使用pywin32和Pillow库
Jun 04 Python
Python OpenCV读取中文路径图像的方法
Jul 02 Python
Pytorch上下采样函数--interpolate用法
Jul 07 Python
一篇文章弄懂Python中的可迭代对象、迭代器和生成器
Aug 12 #Python
Django认证系统实现的web页面实现代码
Aug 12 #Python
django 自定义过滤器(filter)处理较为复杂的变量方法
Aug 12 #Python
django-filter和普通查询的例子
Aug 12 #Python
利用python实现汉字转拼音的2种方法
Aug 12 #Python
python面向对象 反射原理解析
Aug 12 #Python
Python中正反斜杠(‘/’和‘\’)的意义与用法
Aug 12 #Python
You might like
php.ini修改php上传文件大小限制的方法详解
2013/06/17 PHP
php获取QQ头像并显示的方法
2014/12/23 PHP
php使用自定义函数实现汉字分割替换功能示例
2017/01/30 PHP
javascript 同时在IE和FireFox获取KeyCode的代码
2010/02/07 Javascript
js 在定义的时候立即执行的函数表达式(function)写法
2013/01/16 Javascript
js创建子窗口并且回传值示例代码
2013/07/02 Javascript
jquery $(this).attr $(this).val方法使用介绍
2013/10/08 Javascript
nodejs爬虫抓取数据乱码问题总结
2015/07/03 NodeJs
jquery控制显示服务器生成的图片流
2015/08/04 Javascript
js点击按钮实现带遮罩层的弹出视频效果
2015/12/19 Javascript
js简单获取表单中单选按钮值的方法
2016/08/23 Javascript
angularjs下ng-repeat点击元素改变样式的实现方法
2018/09/12 Javascript
vue组件中的样式属性scoped实例详解
2018/10/30 Javascript
vue使用i18n实现国际化的方法详解
2019/09/05 Javascript
layui关闭层级、简单监听的实例
2019/09/06 Javascript
vue项目实现图片上传功能
2019/12/23 Javascript
Vue+axios封装请求实现前后端分离
2020/10/23 Javascript
Python获取服务器信息的最简单实现方法
2015/03/05 Python
python实现搜索本地文件信息写入文件的方法
2016/02/22 Python
Python中property函数用法实例分析
2018/06/04 Python
python调用opencv实现猫脸检测功能
2019/01/15 Python
python利用Tesseract识别验证码的方法示例
2019/01/21 Python
python使用MQTT给硬件传输图片的实现方法
2019/05/05 Python
Python守护进程实现过程详解
2020/02/10 Python
python调用百度AI接口实现人流量统计
2021/02/03 Python
PUMA官方商城:世界领先的运动品牌之一
2016/11/16 全球购物
Superdry瑞典官网:英国日本街头风品牌
2017/05/17 全球购物
巴黎卡诗美国官方网站:始于1964年的头发头皮护理专家
2017/07/10 全球购物
阿迪达斯香港官网:adidas香港
2019/11/09 全球购物
小学生中国梦演讲稿
2014/04/23 职场文书
《他得的红圈圈最多》教学反思
2014/04/24 职场文书
本科生自荐信
2014/06/18 职场文书
python实现高效的遗传算法
2021/04/07 Python
Python编程super应用场景及示例解析
2021/10/05 Python
Mysql排序的特性详情
2021/11/01 MySQL
JVM的类加载器和双亲委派模式你了解吗
2022/03/13 Java/Android