Python实现批量读取word中表格信息的方法


Posted in Python onJuly 30, 2015

本文实例讲述了Python实现批量读取word中表格信息的方法。分享给大家供大家参考。具体如下:

单位收集了很多word格式的调查表,领导需要收集表单里的信息,我就把所有调查表放一个文件里,写了个python小程序把所需的信息打印出来

#coding:utf-8
import os
import win32com
from win32com.client import Dispatch, constants
from docx import Document
def parse_doc(f):
  """读取doc,返回姓名和行业
  """
  doc = w.Documents.Open( FileName = f )
  t = doc.Tables[0] # 根据文件中的图表选择信息
  name = t.Rows[0].Cells[1].Range.Text  
  situation = t.Rows[0].Cells[5].Range.Text
  people = t.Rows[1].Cells[1].Range.Text
  title = t.Rows[1].Cells[3].Range.Text  
  print name, situation, people,title
  doc.Close()
def parse_docx(f):
  """读取docx,返回姓名和行业
  """
  d = Document(f)
  t = d.tables[0]
  name = t.cell(0,1).text
  situation = t.cell(0,8).text
  people = t.cell(1,2).text
  title = t.cell(1,8).text
  print name, situation, people,title
if __name__ == "__main__":
  w = win32com.client.Dispatch('Word.Application')
  # 遍历文件
  PATH = "H:\work\\aaa" # windows文件路径
  doc_files = os.listdir(PATH)
  for doc in doc_files:
    if os.path.splitext(doc)[1] == '.docx':
      try:
        parse_docx(PATH+'\\'+doc)
      except Exception as e:
        print e
    elif os.path.splitext(doc)[1] == '.doc':
      try:
        parse_doc(PATH+'\\'+doc)
      except Exception as e:
        print e

希望本文所述对大家的Python程序设计有所帮助。

Python 相关文章推荐
Python获取网页上图片下载地址的方法
Mar 11 Python
Python实现查找匹配项作处理后再替换回去的方法
Jun 10 Python
python放大图片和画方格实现算法
Mar 30 Python
PyTorch快速搭建神经网络及其保存提取方法详解
Apr 28 Python
python 文本单词提取和词频统计的实例
Dec 22 Python
django中ORM模型常用的字段的使用方法
Mar 05 Python
Python实现二叉搜索树BST的方法示例
Jul 30 Python
利用python实现逐步回归
Feb 24 Python
Java Spring项目国际化(i18n)详细方法与实例
Mar 20 Python
sklearn的predict_proba使用说明
Jun 28 Python
基于logstash实现日志文件同步elasticsearch
Aug 06 Python
10个python爬虫入门实例(小结)
Nov 01 Python
python删除特定文件的方法
Jul 30 #Python
Python通过90行代码搭建一个音乐搜索工具
Jul 29 #Python
Python的迭代器和生成器
Jul 29 #Python
在Python程序中操作MySQL的基本方法
Jul 29 #Python
Python操作Word批量生成文章的方法
Jul 28 #Python
Python实现批量转换文件编码的方法
Jul 28 #Python
Python中subprocess的简单使用示例
Jul 28 #Python
You might like
收集的PHP中与数组相关的函数
2007/03/22 PHP
Trying to clone an uncloneable object of class Imagic的解决方法
2012/01/11 PHP
深入解析PHP的Yii框架中的event事件机制
2016/03/17 PHP
php处理多图上传压缩代码功能
2018/06/13 PHP
innertext , insertadjacentelement , insertadjacenthtml , insertadjacenttext 等区别
2007/06/29 Javascript
JavaScript入门教程(12) js对象化编程
2009/01/31 Javascript
extjs 列表框(multiselect)的动态添加列表项的方法
2009/07/31 Javascript
dwz 如何去掉ajaxloading具体代码
2013/05/22 Javascript
jQuery中使用data()方法读取HTML5自定义属性data-*实例
2014/04/11 Javascript
javascript实现Table间隔色以及选择高亮(和动态切换数据)的方法
2015/05/14 Javascript
JavaScript保存并运算页面中数字类型变量的写法
2015/07/06 Javascript
javascript中this指向详解
2016/04/23 Javascript
基于JS实现EOS隐藏错误提示层代码
2016/04/25 Javascript
微信QQ的二维码登录原理js代码解析
2016/06/23 Javascript
js 实现一些跨浏览器的事件方法详解及实例
2016/10/27 Javascript
jQuery异步提交表单实例
2017/05/30 jQuery
Angular2监听页面大小变化的解决方法
2017/10/09 Javascript
react-redux中connect的装饰器用法@connect详解
2018/01/13 Javascript
微信小程序上传图片实例
2018/05/28 Javascript
JS控制下拉列表左右选择实例代码
2020/05/08 Javascript
vue-iview动态新增和删除的方法
2020/06/17 Javascript
ant design vue中日期选择框混合时间选择器的用法说明
2020/10/27 Javascript
JavaScript实现网页动态生成表格
2020/11/25 Javascript
Python StringIO模块实现在内存缓冲区中读写数据
2015/04/08 Python
pycharm 将python文件打包为exe格式的方法
2019/01/16 Python
解决使用PyCharm时无法启动控制台的问题
2019/01/19 Python
python 读取修改pcap包的例子
2019/07/23 Python
python常见字符串处理函数与用法汇总
2019/10/30 Python
Python面向对象程序设计之私有变量,私有方法原理与用法分析
2020/03/23 Python
django的403/404/500错误自定义页面的配置方式
2020/05/21 Python
HTML5新控件之日期和时间选择输入的实现代码
2018/09/13 HTML / CSS
中职应届生会计求职信
2013/10/23 职场文书
2014年秋季新学期寄语
2014/08/02 职场文书
2014年全国法制宣传日宣传活动方案
2014/11/02 职场文书
给老婆的检讨书
2015/01/27 职场文书
多人股份制合作协议书
2016/03/19 职场文书