Python实现简单文本字符串处理的方法


Posted in Python onJanuary 22, 2018

本文实例讲述了Python实现简单文本字符串处理的方法。分享给大家供大家参考,具体如下:

对于一个文本字符串,可以使用Python的string.split()方法将其切割。下面看看实际运行效果。

mySent = 'This book is the best book on python!'
print mySent.split()

输出:

['This', 'book', 'is', 'the', 'best', 'book', 'on', 'python!']

可以看到,切分的效果不错,但是标点符号也被当成了词,可以使用正则表达式来处理,其中分隔符是除单词、数字外的任意字符串。

import re
reg = re.compile('\\W*')
mySent = 'This book is the best book on python!'
listof = reg.split(mySent)
print listof

输出为:

['This', 'book', 'is', 'the', 'best', 'book', 'on', 'python', '']

现在得到了一系列词组成的词表,但是里面的空字符串需要去掉。

可以计算每个字符串的长度,只返回大于0的字符串。

import re
reg = re.compile('\\W*')
mySent = 'This book is the best book on python!'
listof = reg.split(mySent)
new_list = [tok for tok in listof if len(tok)>0]
print new_list

输出为:

['This', 'book', 'is', 'the', 'best', 'book', 'on', 'python']

最后,发现句子中的第一个字母是大写的。我们需要同一形式,把大写转化为小写。Python内嵌的方法,可以将字符串全部转化为小写(.lower())或大写(.upper())

import re
reg = re.compile('\\W*')
mySent = 'This book is the best book on python!'
listof = reg.split(mySent)
new_list = [tok.lower() for tok in listof if len(tok)>0]
print new_list

输出为:

['this', 'book', 'is', 'the', 'best', 'book', 'on', 'python']

下面来看一封完整的电子邮件:

内容

Hi Peter,

With Jose out of town, do you want to
meet once in a while to keep things
going and do some interesting stuff?

Let me know
Eugene
import re
reg = re.compile('\\W*')
email = open('email.txt').read()
list = reg.split(email)
new_txt = [tok.lower() for tok in list if len(tok)>0]
print new_txt

输出:

['hi', 'peter', 'with', 'jose', 'out', 'of', 'town', 'do', 'you', 'want', 'to', 'meet', 'once', 'in', 'a', 'while', 'to', 'keep', 'things', 'going', 'and', 'do', 'some', 'interesting', 'stuff', 'let', 'me', 'know', 'eugene']

更多关于Python相关内容可查看本站专题:《Python字符串操作技巧汇总》、《Python数据结构与算法教程》、《Python函数使用技巧总结》、《Python入门与进阶经典教程》及《Python文件与目录操作技巧汇总》

希望本文所述对大家Python程序设计有所帮助。

Python 相关文章推荐
Python运用于数据分析的简单教程
Mar 27 Python
举例讲解Python的Tornado框架实现数据可视化的教程
May 02 Python
PyCharm代码格式调整方法
May 23 Python
numpy linalg模块的具体使用方法
May 26 Python
Django1.11配合uni-app发起微信支付的实现
Oct 12 Python
Python Django框架url反向解析实现动态生成对应的url链接示例
Oct 18 Python
Python通过2种方法输出带颜色字体
Mar 02 Python
Python super()方法原理详解
Mar 31 Python
python中matplotlib实现随鼠标滑动自动标注代码
Apr 23 Python
Python logging模块写入中文出现乱码
May 21 Python
python爬虫利器之requests库的用法(超全面的爬取网页案例)
Dec 17 Python
Python OpenCV实现传统图片格式与base64转换
Jun 13 Python
Python简单实现控制电脑的方法
Jan 22 #Python
Zookeeper接口kazoo实例解析
Jan 22 #Python
Python调用C语言的方法【基于ctypes模块】
Jan 22 #Python
python的Crypto模块实现AES加密实例代码
Jan 22 #Python
python实现求最长回文子串长度
Jan 22 #Python
Python获取本机所有网卡ip,掩码和广播地址实例代码
Jan 22 #Python
Linux CentOS7下安装python3 的方法
Jan 21 #Python
You might like
php header Content-Type类型小结
2011/07/03 PHP
PHP性能优化工具篇Benchmark类调试执行时间
2011/12/06 PHP
CI框架Session.php源码分析
2014/11/03 PHP
php函数重载的替代方法--伪重载详解
2015/05/08 PHP
thinkPHP5分页功能实现方法分析
2017/10/25 PHP
PHP的重载使用魔术方法代码实例详解
2021/02/26 PHP
Javascript学习笔记-详解in运算符
2011/09/13 Javascript
jquery统计复选框选中示例
2013/11/05 Javascript
一个非常全面的javascript URL解析函数和分段URL解析方法
2014/04/12 Javascript
JS动态改变表格边框宽度的方法
2015/03/31 Javascript
jQuery固定元素插件scrolltofixed使用指南
2015/04/21 Javascript
JavaScript节点及列表操作实例小结
2015/08/05 Javascript
复杂的javascript窗口分帧解析
2016/02/19 Javascript
vuejs动态组件给子组件传递数据的方法详解
2016/09/09 Javascript
Bootstrap 表单验证formValidation 实现表单动态验证功能
2017/05/17 Javascript
Vue监听数据渲染DOM完以后执行某个函数详解
2018/09/11 Javascript
Vue CLI3.0中使用jQuery和Bootstrap的方法
2019/02/28 jQuery
JavaScript函数定义方法实例详解
2019/03/05 Javascript
JavaScript生成一个不重复的ID的方法示例
2019/09/16 Javascript
JavaScript制作3D旋转相册
2020/08/02 Javascript
vue父子组件的通信方法(实例详解)
2019/11/10 Javascript
JavaScript中继承原理与用法实例入门
2020/05/09 Javascript
在Vue里如何把网页的数据导出到Excel的方法
2020/09/30 Javascript
[05:35]DOTA2英雄梦之声_第13期_拉比克
2014/06/21 DOTA
python切换hosts文件代码示例
2013/12/31 Python
python实现的一个火车票转让信息采集器
2014/07/09 Python
Python做智能家居温湿度报警系统
2018/09/25 Python
Python产生Gnuplot绘图数据的方法
2018/11/09 Python
基于Python的微信机器人开发 微信登录和获取好友列表实现解析
2019/08/21 Python
python调用有道智云API实现文件批量翻译
2020/10/10 Python
python 进制转换 int、bin、oct、hex的原理
2021/01/13 Python
大一学生假期实习的自我评价
2013/10/12 职场文书
动画设计系毕业生求职信
2014/07/15 职场文书
安全先进班组材料
2014/12/26 职场文书
2015年大学社团工作总结
2015/04/09 职场文书
儿子满月酒致辞
2015/07/29 职场文书