python删除字符串中指定字符的方法


Posted in Python onAugust 13, 2018

最近开始学机器学习,学习分析垃圾邮件,其中有一部分是要求去除一段字符中的标点符号,查了一下,网上的大多很复杂例如这样

import re 
temp = "司法局让我和户 1 5. 8 0. !!?? 客户维护户外" 
temp = temp.decode("utf8") 
string = re.sub("[\s+\.\!\/_,$%^*(+\"\']+|[+——!,。?、~@#¥%……&*()]+".decode("utf8"), "".decode("utf8"),temp) 
print string

或者是这样的

'''引入string模块'''
import string
'''使用标点符号常量'''
string.punctuation
text = "*/@》--【】--12()测试*()"

'''去除字符串中所有的字符,可增加自定义字符'''
def strclear(text,newsign=''):
  import string # 引入string模块
  signtext = string.punctuation + newsign # 引入英文符号常量,可附加自定义字符,默认为空
  signrepl = '@'*len(signtext) # 引入符号列表长度的替换字符
  signtable = str.maketrans(signtext,signrepl) # 生成替换字符表
  return text.translate(signtable).replace('@','') # 最后将替换字符替换为空即可

strclear(text,'》【】')

我一开始用的后面的这个,着实是有点暴力,于是找了查了一下原文档,发现python3中完全有更好的方法去实现这样的功能(似乎是新更新的?不太清楚,我的是python最新版本3.6.6)

和上面的方法一样是利用的是str的translate()和maketrans()

translate()自然不用说这里的重点是maketrans(),先放上官方的文档

static str.maketrans(x[, y[, z]])
This static method returns a translation table usable for str.translate().

If there is only one argument, 
it must be a dictionary mapping Unicode ordinals (integers) or characters (strings of length 1) to Unicode ordinals, 
strings (of arbitrary lengths) or None. Character keys will then be converted to ordinals.

If there are two arguments, 
they must be strings of equal length, 
and in the resulting dictionary, 
each character in x will be mapped to the character at the same position in y. 
If there is a third argument, it must be a string, whose characters will be mapped to None in the result.

可以看出maketrans是可以放三个参数的(以前一直以为只有两个....)

前两个参数是需要一一对应进行替换,需要字符串长度相同

第三个参数是直接替换为None

这里就直接上代码了

import string

i = 'Hello, how are you!'

i.translate(str.maketrans('', '', string.punctuation))
>>>'Hello how are you'

 i = 'hello world i am li'
 i.translate(str.maketrans('','','l'))

>>>'heo word i am i'

这里的string.punctuation 是python内置的标点符号的合集

既然看到了就总结下

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
用pywin32实现windows模拟鼠标及键盘动作
Apr 22 Python
python完成FizzBuzzWhizz问题(拉勾网面试题)示例
May 05 Python
Python搜索引擎实现原理和方法
Nov 27 Python
python获取文件真实链接的方法,针对于302返回码
May 14 Python
python3实现爬取淘宝美食代码分享
Sep 23 Python
Python中format()格式输出全解
Apr 12 Python
numpy下的flatten()函数用法详解
May 27 Python
python接口调用已训练好的caffe模型测试分类方法
Aug 26 Python
Python实现的爬取豆瓣电影信息功能案例
Sep 15 Python
Python读入mnist二进制图像文件并显示实例
Apr 24 Python
python如何利用paramiko执行服务器命令
Nov 07 Python
Python 实现PS滤镜的旋涡特效
Dec 03 Python
Django contenttypes 框架详解(小结)
Aug 13 #Python
Python中的Numpy矩阵操作
Aug 12 #Python
浅谈python之新式类
Aug 12 #Python
详解Django中类视图使用装饰器的方式
Aug 12 #Python
python中pip的安装与使用教程
Aug 10 #Python
python3判断url链接是否为404的方法
Aug 10 #Python
Python实现数据可视化看如何监控你的爬虫状态【推荐】
Aug 10 #Python
You might like
zend framework多模块多布局配置
2011/02/26 PHP
php调用mysql存储过程实例分析
2014/12/29 PHP
PHP7 echo和print语句实例用法
2019/02/15 PHP
用javascript获取当页面上鼠标光标位置和触发事件的对象的代码
2009/12/09 Javascript
js、jquery图片动画、动态切换示例代码
2014/06/03 Javascript
javascript实现回到顶部特效
2015/05/06 Javascript
JavaScript判断是否是微信浏览器
2016/06/13 Javascript
动手写一个angular版本的Message组件的方法
2017/12/16 Javascript
iview table高度动态设置方法
2018/03/14 Javascript
swiper在vue项目中loop循环轮播失效的解决方法
2018/09/15 Javascript
浅谈JS和jQuery的区别
2019/03/27 jQuery
JavaScript 性能提升之路(推荐)
2019/04/10 Javascript
浅析Python中return和finally共同挖的坑
2017/08/18 Python
python将.ppm格式图片转换成.jpg格式文件的方法
2018/10/27 Python
Python版名片管理系统
2018/11/30 Python
浅谈Python中eval的强大与危害
2019/03/13 Python
python SVD压缩图像的实现代码
2019/11/05 Python
python3实现elasticsearch批量更新数据
2019/12/03 Python
python 生成器需注意的小问题
2020/09/29 Python
python 利用opencv实现图像网络传输
2020/11/12 Python
Python logging自定义字段输出及打印颜色
2020/11/30 Python
pycharm 配置svn的图文教程(手把手教你)
2021/01/15 Python
纯CSS3制作页面切换效果的实例代码
2019/05/30 HTML / CSS
html5将图片转换成base64的实例代码
2016/09/21 HTML / CSS
StubHub澳大利亚:购买或出售您的门票
2019/08/01 全球购物
Roxy俄罗斯官方网站:冲浪和滑雪板的一切
2020/06/20 全球购物
高中自我鉴定范文
2013/11/03 职场文书
五年级科学教学反思
2014/02/05 职场文书
校庆标语集锦
2014/06/25 职场文书
市场营销工作计划书
2014/09/15 职场文书
美术教师求职信范文
2015/03/20 职场文书
保研推荐信范文
2015/03/25 职场文书
2015秋季新学期开学寄语
2015/05/28 职场文书
小学入学感言
2015/08/01 职场文书
建议书的格式及范文
2015/09/14 职场文书
2019年房屋委托租赁合同范本(通用版)!
2019/07/17 职场文书