Python实现批量读取word中表格信息的方法


Posted in Python onJuly 30, 2015

本文实例讲述了Python实现批量读取word中表格信息的方法。分享给大家供大家参考。具体如下:

单位收集了很多word格式的调查表,领导需要收集表单里的信息,我就把所有调查表放一个文件里,写了个python小程序把所需的信息打印出来

#coding:utf-8
import os
import win32com
from win32com.client import Dispatch, constants
from docx import Document
def parse_doc(f):
  """读取doc,返回姓名和行业
  """
  doc = w.Documents.Open( FileName = f )
  t = doc.Tables[0] # 根据文件中的图表选择信息
  name = t.Rows[0].Cells[1].Range.Text  
  situation = t.Rows[0].Cells[5].Range.Text
  people = t.Rows[1].Cells[1].Range.Text
  title = t.Rows[1].Cells[3].Range.Text  
  print name, situation, people,title
  doc.Close()
def parse_docx(f):
  """读取docx,返回姓名和行业
  """
  d = Document(f)
  t = d.tables[0]
  name = t.cell(0,1).text
  situation = t.cell(0,8).text
  people = t.cell(1,2).text
  title = t.cell(1,8).text
  print name, situation, people,title
if __name__ == "__main__":
  w = win32com.client.Dispatch('Word.Application')
  # 遍历文件
  PATH = "H:\work\\aaa" # windows文件路径
  doc_files = os.listdir(PATH)
  for doc in doc_files:
    if os.path.splitext(doc)[1] == '.docx':
      try:
        parse_docx(PATH+'\\'+doc)
      except Exception as e:
        print e
    elif os.path.splitext(doc)[1] == '.doc':
      try:
        parse_doc(PATH+'\\'+doc)
      except Exception as e:
        print e

希望本文所述对大家的Python程序设计有所帮助。

Python 相关文章推荐
Python中使用scapy模拟数据包实现arp攻击、dns放大攻击例子
Oct 23 Python
python黑魔法之参数传递
Feb 12 Python
Python的SQLalchemy模块连接与操作MySQL的基础示例
Jul 11 Python
python之文件的读写和文件目录以及文件夹的操作实现代码
Aug 28 Python
Python标准库之collections包的使用教程
Apr 27 Python
Python向日志输出中添加上下文信息
May 24 Python
对python中两种列表元素去重函数性能的比较方法
Jun 29 Python
Python小白学习爬虫常用请求报头
Jun 03 Python
Python中如何添加自定义模块
Jun 09 Python
了解一下python内建模块collections
Sep 07 Python
python中温度单位转换的实例方法
Dec 27 Python
Python常遇到的错误和异常
Nov 02 Python
python删除特定文件的方法
Jul 30 #Python
Python通过90行代码搭建一个音乐搜索工具
Jul 29 #Python
Python的迭代器和生成器
Jul 29 #Python
在Python程序中操作MySQL的基本方法
Jul 29 #Python
Python操作Word批量生成文章的方法
Jul 28 #Python
Python实现批量转换文件编码的方法
Jul 28 #Python
Python中subprocess的简单使用示例
Jul 28 #Python
You might like
PHP.MVC的模板标签系统(三)
2006/09/05 PHP
PHP抽象类与接口的区别详解
2019/03/21 PHP
PHP生成随机字符串实例代码(字母+数字)
2019/09/11 PHP
分享几种好用的PHP自定义加密函数(可逆/不可逆)
2020/09/15 PHP
javascript中获取选中对象的类型
2007/04/02 Javascript
javascript SocialHistory 检查访问者是否访问过某站点
2008/08/02 Javascript
几个常用的JavaScript字符串处理函数 - split()、join()、substring()和indexOf()
2009/06/02 Javascript
JQuery与Ajax常用代码实现对比
2009/10/03 Javascript
基于Jquery的简单&简陋Tabs插件代码
2010/02/09 Javascript
JavaScript 以对象为索引的关联数组
2010/05/19 Javascript
select 控制网页内容隐藏于显示的实现代码
2010/05/25 Javascript
JS去除数组重复值的五种不同方法
2013/09/06 Javascript
jquery 页面滚动到底部自动加载插件集合
2014/01/31 Javascript
怎么判断js脚本加载完成
2014/02/28 Javascript
基于jquery实现复选框全选,反选,全不选等功能
2015/10/16 Javascript
JS判断日期格式是否合法的简单实例
2016/07/11 Javascript
js图片上传前预览功能(兼容所有浏览器)
2016/08/24 Javascript
浅谈vue项目优化之页面的按需加载(vue+webpack)
2017/12/11 Javascript
vue小白入门教程
2018/04/02 Javascript
vue-router的HTML5 History 模式设置
2018/09/08 Javascript
CKeditor4 字体颜色功能配置方法教程
2019/06/26 Javascript
Vuex中的Mutations的具体使用方法
2020/06/01 Javascript
[01:20:37]FNATIC vs NIP 2019国际邀请赛小组赛 BO2 第一场 8.16
2019/08/19 DOTA
python回调函数的使用方法
2014/01/23 Python
使用python调用浏览器并打开一个网址的例子
2014/06/05 Python
pytorch: tensor类型的构建与相互转换实例
2018/07/26 Python
vim自动补全插件YouCompleteMe(YCM)安装过程解析
2019/10/21 Python
win10下安装Anaconda的教程(python环境+jupyter_notebook)
2019/10/23 Python
Selenium自动化测试工具使用方法汇总
2020/06/12 Python
深入解析HTML5使用SVG图像时的viewBox属性用法
2015/09/02 HTML / CSS
我们的节日端午节活动方案
2014/03/02 职场文书
职业生涯规划书结束语
2014/04/15 职场文书
优秀党员事迹材料
2014/12/18 职场文书
幼儿园师德师风心得体会
2016/01/12 职场文书
党组织关系的介绍信模板
2019/06/21 职场文书
关于golang高并发的实现与注意事项说明
2021/05/08 Golang