python实现替换word中的关键文字(使用通配符)


Posted in Python onFebruary 13, 2020

环境:Python3.6

本文主要是通过win32com操作word,对word中进行常用的操作。本文以替换为例,讲解一下如何使用Python在word中使用“通配符模式”(类似于正则表达式)替换文本内容。

#!/usr/bin/env python
# -*- coding:utf-8 -*-
import os
import win32com
from win32com.client import Dispatch
 
 
# 处理Word文档的类
 
class RemoteWord:
    def __init__(self, filename=None):
        self.xlApp = win32com.client.Dispatch('Word.Application') # 此处使用的是Dispatch,原文中使用的DispatchEx会报错
        self.xlApp.Visible = 0 # 后台运行,不显示
        self.xlApp.DisplayAlerts = 0  #不警告
        if filename:
            self.filename = filename
            if os.path.exists(self.filename):
                self.doc = self.xlApp.Documents.Open(filename)
            else:
                self.doc = self.xlApp.Documents.Add()  # 创建新的文档
                self.doc.SaveAs(filename)
        else:
            self.doc = self.xlApp.Documents.Add()
            self.filename = ''
 
    def add_doc_end(self, string):
        '''在文档末尾添加内容'''
        rangee = self.doc.Range()
        rangee.InsertAfter('\n' + string)
 
    def add_doc_start(self, string):
        '''在文档开头添加内容'''
        rangee = self.doc.Range(0, 0)
        rangee.InsertBefore(string + '\n')
 
    def insert_doc(self, insertPos, string):
        '''在文档insertPos位置添加内容'''
        rangee = self.doc.Range(0, insertPos)
        if (insertPos == 0):
            rangee.InsertAfter(string)
        else:
            rangee.InsertAfter('\n' + string)
 
    def replace_doc(self, string, new_string):
        '''替换文字'''
        self.xlApp.Selection.Find.ClearFormatting()
        self.xlApp.Selection.Find.Replacement.ClearFormatting()
        #(string--搜索文本,
        # True--区分大小写,
        # True--完全匹配的单词,并非单词中的部分(全字匹配),
        # True--使用通配符,
        # True--同音,
        # True--查找单词的各种形式,
        # True--向文档尾部搜索,
        # 1,
        # True--带格式的文本,
        # new_string--替换文本,
        # 2--替换个数(全部替换)
        self.xlApp.Selection.Find.Execute(string, False, False, False, False, False, True, 1, True, new_string, 2)
 
    def replace_docs(self, string, new_string):
        '''采用通配符匹配替换'''
        self.xlApp.Selection.Find.ClearFormatting()
        self.xlApp.Selection.Find.Replacement.ClearFormatting()
        self.xlApp.Selection.Find.Execute(string, False, False, True, False, False, False, 1, False, new_string, 2)
    def save(self):
        '''保存文档'''
        self.doc.Save()
 
    def save_as(self, filename):
        '''文档另存为'''
        self.doc.SaveAs(filename)
 
    def close(self):
        '''保存文件、关闭文件'''
        self.save()
        self.xlApp.Documents.Close()
        self.xlApp.Quit()
 
 
if __name__ == '__main__':
 
    # path = 'E:\\XXX.docx'
    path = 'E:/XXX.docx'
    doc = RemoteWord(path)  # 初始化一个doc对象
    # 这里演示替换内容,其他功能自己按照上面类的功能按需使用
 
    doc.replace_doc(' ', '')  # 替换文本内容
    doc.replace_doc('.', '.') # 替换.为.
    doc.replace_doc('\n', '')  # 去除空行
    doc.replace_doc('o','0')  # 替换o为0
    # doc.replace_docs('([0-9])@[、,,]([0-9])@', '\1.\2')  使用@不能识别改用{1,},\需要使用反斜杠转义
    doc.replace_docs('([0-9]){1,}[、,,.]([0-9]){1,}', '\\1.\\2')  # 将数字中间的,,、.替换成.
    doc.replace_docs('([0-9]){1,}[旧]([0-9]){1,}', '\\101\\2')   # 将数字中间的“旧”替换成“01”
    doc.close()

以上这篇python实现替换word中的关键文字(使用通配符)就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
使用python将mdb数据库文件导入postgresql数据库示例
Feb 17 Python
Python中os和shutil模块实用方法集锦
May 13 Python
Python中取整的几种方法小结
Jan 06 Python
python版微信跳一跳游戏辅助
Jan 11 Python
Tensorflow环境搭建的方法步骤
Feb 07 Python
Django中针对基于类的视图添加csrf_exempt实例代码
Feb 11 Python
Python for循环生成列表的实例
Jun 15 Python
值得收藏的10道python 面试题
Apr 15 Python
python内存管理机制原理详解
Aug 12 Python
Python 实现将数组/矩阵转换成Image类
Jan 09 Python
Python读取VOC中的xml目标框实例
Mar 10 Python
jupyter notebook 调用环境中的Keras或者pytorch教程
Apr 14 Python
python isinstance函数用法详解
Feb 13 #Python
Python中的X[:,0]、X[:,1]、X[:,:,0]、X[:,:,1]、X[:,m:n]和X[:,:,m:n]
Feb 13 #Python
基于python的docx模块处理word和WPS的docx格式文件方式
Feb 13 #Python
python 中的[:-1]和[::-1]的具体使用
Feb 13 #Python
Python使用docx模块实现刷题功能代码
Feb 13 #Python
Tensorflow训练MNIST手写数字识别模型
Feb 13 #Python
Python3 读取Word文件方式
Feb 13 #Python
You might like
php多个字符串替换成同一个的解决方法
2013/06/18 PHP
php采集中国代理服务器网的方法
2015/06/16 PHP
php输出图像的方法实例分析
2017/02/16 PHP
JavaScript 用Node.js写Shell脚本[译]
2012/09/20 Javascript
利用js读取动态网站从服务器端返回的数据
2014/02/10 Javascript
jquery1.10给新增元素绑定事件的方法
2014/03/06 Javascript
JavaScript 事件绑定及深入
2015/04/13 Javascript
再谈JavaScript线程
2015/07/10 Javascript
基于jquery实现即时检查格式是否正确的表单
2016/05/06 Javascript
Bootstrap登陆注册页面开发教程
2016/07/12 Javascript
AngularJS入门教程之ng-class 指令用法
2016/08/01 Javascript
JavaScript+HTML5实现的日期比较功能示例
2017/07/12 Javascript
angular中子控制器向父控制器传值的实例
2018/10/08 Javascript
JS中注入eval, Function等系统函数截获动态代码
2019/04/03 Javascript
js实现简单页面全屏
2019/09/17 Javascript
vue.config.js常用配置详解
2019/11/14 Javascript
JavaScript中的几种继承方法示例
2020/12/06 Javascript
[01:28]一分钟告诉你DOTA2 TI9不朽宝藏Ⅱ中有什么!
2019/07/09 DOTA
python实现同时给多个变量赋值的方法
2015/04/30 Python
python实现逻辑回归的方法示例
2017/05/02 Python
Django中更改默认数据库为mysql的方法示例
2018/12/05 Python
使用Python将Mysql的查询数据导出到文件的方法
2019/02/25 Python
Python调用graphviz绘制结构化图形网络示例
2019/11/22 Python
PyTorch使用cpu加载模型运算方式
2020/01/13 Python
Python作用域与名字空间原理详解
2020/03/21 Python
Python+Opencv身份证号码区域提取及识别实现
2020/08/25 Python
scrapy利用selenium爬取豆瓣阅读的全步骤
2020/09/20 Python
Madewell澳大利亚官方网站:美国休闲服饰品牌
2019/07/18 全球购物
集体婚礼证婚词
2014/01/13 职场文书
银行职员个人的工作自我评价
2014/02/15 职场文书
参观接待方案
2014/03/17 职场文书
个人违纪检讨书
2014/09/15 职场文书
四风问题个人对照检查材料
2014/09/26 职场文书
幼儿园三八妇女节活动总结
2015/02/06 职场文书
重阳节座谈会主持词
2015/07/03 职场文书
FP-growth算法发现频繁项集——发现频繁项集
2021/06/24 Python