Python3处理文件中每个词的方法


Posted in Python onMay 22, 2015

本文实例讲述了Python3处理文件中每个词的方法。分享给大家供大家参考。具体实现方法如下:

''''' 
Created on Dec 21, 2012 
处理文件中的每个词 
@author: liury_lab 
''' 
import codecs 
the_file = codecs.open('d:/text.txt', 'rU', 'UTF-8') 
for line in the_file: 
  for word in line.split(): 
    print(word, end = "|") 
the_file.close() 
# 若词的定义有变,可使用正则表达式 
# 如词被定义为数字字母,连字符或单引号构成的序列 
import re 
the_file = codecs.open('d:/text.txt', 'rU', 'UTF-8') 
print() 
print('************************************************************************') 
re_word = re.compile('[\w\'-]+') 
for line in the_file: 
  for word in re_word.finditer(line): 
    print(word.group(0), end = "|") 
the_file.close() 
# 封装成迭代器 
def words_of_file(file_path, line_to_words = str.split): 
  the_file = codecs.open('d:/text.txt', 'rU', 'UTF-8') 
  for line in the_file: 
    for word in line_to_words(line): 
      yield word 
  the_file.close() 
print() 
print('************************************************************************') 
for word in words_of_file('d:/text.txt'): 
  print(word, end = '|') 
def words_by_re(file_path, repattern = '[\w\'-]+'): 
  the_file = codecs.open('d:/text.txt', 'rU', 'UTF-8') 
  re_word = re.compile('[\w\'-]+') 
 
  def line_to_words(line): 
    for mo in re_word.finditer(line): 
      yield mo.group(0) # 原书为return,发现结果不对,改为yield 
  return words_of_file(file_path, line_to_words) 
print() 
print('************************************************************************') 
for word in words_by_re('d:/text.txt'): 
  print(word, end = '|')

希望本文所述对大家的Python程序设计有所帮助。

Python 相关文章推荐
Python生成随机MAC地址
Mar 10 Python
pygame游戏之旅 添加游戏界面按键图形
Nov 20 Python
pandas DataFrame索引行列的实现
Jun 04 Python
python多线程并发实例及其优化
Jun 27 Python
python实现简单成绩录入系统
Sep 19 Python
在Python中使用MongoEngine操作数据库教程实例
Dec 03 Python
关于tf.reverse_sequence()简述
Jan 20 Python
Python线程threading模块用法详解
Feb 26 Python
Python操作Jira库常用方法解析
Apr 10 Python
jenkins+python自动化测试持续集成教程
May 12 Python
python爬取代理ip的示例
Dec 18 Python
解决pytorch-gpu 安装失败的记录
May 24 Python
Python3读取UTF-8文件及统计文件行数的方法
May 22 #Python
在Python中操作时间之mktime()方法的使用教程
May 22 #Python
Python中的localtime()方法使用详解
May 22 #Python
在Python中操作日期和时间之gmtime()方法的使用
May 22 #Python
Python中的ctime()方法使用教程
May 22 #Python
Python3实现从文件中读取指定行的方法
May 22 #Python
Python3搜索及替换文件中文本的方法
May 22 #Python
You might like
用php获取远程图片并把它保存到本地的代码
2008/04/07 PHP
php 无法加载mcrypt.dll的解决办法
2013/04/03 PHP
解析php中如何直接执行SHELL
2013/06/28 PHP
php操作csv文件代码实例汇总
2014/09/22 PHP
CI框架常用经典操作类总结(路由,伪静态,分页,session,验证码等)
2016/11/21 PHP
JS保留两位小数 四舍五入函数的小例子
2013/11/20 Javascript
滚动条响应鼠标滑轮事件实现上下滚动的js代码
2014/06/30 Javascript
JavaScript学习笔记之定时器
2015/01/22 Javascript
JS密码生成与强度检测完整实例(附demo源码下载)
2016/04/06 Javascript
字太多用...代替的方法(两种)
2017/03/15 Javascript
Vue2递归组件实现树形菜单
2017/04/10 Javascript
inquirer.js一个用户与命令行交互的工具详解
2019/05/18 Javascript
js点击事件的执行过程实例分析【冒泡与捕获】
2020/04/11 Javascript
vue tab切换,解决echartst图表宽度只有100px的问题
2020/07/19 Javascript
Vue如何循环提取对象数组中的值
2020/11/18 Vue.js
[01:33]完美世界DOTA2联赛PWL S3 集锦第二期
2020/12/21 DOTA
详解Python中的正则表达式的用法
2015/04/09 Python
Django 如何获取前端发送的头文件详解(推荐)
2017/08/15 Python
python复制文件到指定目录的实例
2018/04/27 Python
Python2.7.10以上pip更新及其他包的安装教程
2018/06/12 Python
python将txt文档每行内容循环插入数据库的方法
2018/12/28 Python
python对绑定事件的鼠标、按键的判断实例
2019/07/17 Python
python数据类型之间怎么转换技巧分享
2019/08/20 Python
python实现扫雷游戏的示例
2020/10/20 Python
中国海淘族值得信赖的海淘返利网站:55海淘
2017/01/16 全球购物
美国专注于健康商品的网站:eVitamins
2017/01/23 全球购物
维多利亚的秘密官方网站:Victoria’s Secret
2018/10/24 全球购物
药学专业个人自我评价
2013/11/11 职场文书
美德好少年主要事迹
2014/01/29 职场文书
小学生元旦广播稿
2014/02/21 职场文书
初中新生军训方案
2014/05/13 职场文书
党支部组织生活会整改方案
2014/09/30 职场文书
2015年售后服务工作总结
2015/04/25 职场文书
会计主管竞聘书
2015/09/15 职场文书
React Hook用法示例详解(6个常见hook)
2021/04/28 Javascript
python 如何在list中找Topk的数值和索引
2021/05/20 Python