python实现替换word中的关键文字(使用通配符)


Posted in Python onFebruary 13, 2020

环境:Python3.6

本文主要是通过win32com操作word,对word中进行常用的操作。本文以替换为例,讲解一下如何使用Python在word中使用“通配符模式”(类似于正则表达式)替换文本内容。

#!/usr/bin/env python
# -*- coding:utf-8 -*-
import os
import win32com
from win32com.client import Dispatch
 
 
# 处理Word文档的类
 
class RemoteWord:
    def __init__(self, filename=None):
        self.xlApp = win32com.client.Dispatch('Word.Application') # 此处使用的是Dispatch,原文中使用的DispatchEx会报错
        self.xlApp.Visible = 0 # 后台运行,不显示
        self.xlApp.DisplayAlerts = 0  #不警告
        if filename:
            self.filename = filename
            if os.path.exists(self.filename):
                self.doc = self.xlApp.Documents.Open(filename)
            else:
                self.doc = self.xlApp.Documents.Add()  # 创建新的文档
                self.doc.SaveAs(filename)
        else:
            self.doc = self.xlApp.Documents.Add()
            self.filename = ''
 
    def add_doc_end(self, string):
        '''在文档末尾添加内容'''
        rangee = self.doc.Range()
        rangee.InsertAfter('\n' + string)
 
    def add_doc_start(self, string):
        '''在文档开头添加内容'''
        rangee = self.doc.Range(0, 0)
        rangee.InsertBefore(string + '\n')
 
    def insert_doc(self, insertPos, string):
        '''在文档insertPos位置添加内容'''
        rangee = self.doc.Range(0, insertPos)
        if (insertPos == 0):
            rangee.InsertAfter(string)
        else:
            rangee.InsertAfter('\n' + string)
 
    def replace_doc(self, string, new_string):
        '''替换文字'''
        self.xlApp.Selection.Find.ClearFormatting()
        self.xlApp.Selection.Find.Replacement.ClearFormatting()
        #(string--搜索文本,
        # True--区分大小写,
        # True--完全匹配的单词,并非单词中的部分(全字匹配),
        # True--使用通配符,
        # True--同音,
        # True--查找单词的各种形式,
        # True--向文档尾部搜索,
        # 1,
        # True--带格式的文本,
        # new_string--替换文本,
        # 2--替换个数(全部替换)
        self.xlApp.Selection.Find.Execute(string, False, False, False, False, False, True, 1, True, new_string, 2)
 
    def replace_docs(self, string, new_string):
        '''采用通配符匹配替换'''
        self.xlApp.Selection.Find.ClearFormatting()
        self.xlApp.Selection.Find.Replacement.ClearFormatting()
        self.xlApp.Selection.Find.Execute(string, False, False, True, False, False, False, 1, False, new_string, 2)
    def save(self):
        '''保存文档'''
        self.doc.Save()
 
    def save_as(self, filename):
        '''文档另存为'''
        self.doc.SaveAs(filename)
 
    def close(self):
        '''保存文件、关闭文件'''
        self.save()
        self.xlApp.Documents.Close()
        self.xlApp.Quit()
 
 
if __name__ == '__main__':
 
    # path = 'E:\\XXX.docx'
    path = 'E:/XXX.docx'
    doc = RemoteWord(path)  # 初始化一个doc对象
    # 这里演示替换内容,其他功能自己按照上面类的功能按需使用
 
    doc.replace_doc(' ', '')  # 替换文本内容
    doc.replace_doc('.', '.') # 替换.为.
    doc.replace_doc('\n', '')  # 去除空行
    doc.replace_doc('o','0')  # 替换o为0
    # doc.replace_docs('([0-9])@[、,,]([0-9])@', '\1.\2')  使用@不能识别改用{1,},\需要使用反斜杠转义
    doc.replace_docs('([0-9]){1,}[、,,.]([0-9]){1,}', '\\1.\\2')  # 将数字中间的,,、.替换成.
    doc.replace_docs('([0-9]){1,}[旧]([0-9]){1,}', '\\101\\2')   # 将数字中间的“旧”替换成“01”
    doc.close()

以上这篇python实现替换word中的关键文字(使用通配符)就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python for Informatics 第11章之正则表达式(四)
Apr 21 Python
python、java等哪一门编程语言适合人工智能?
Nov 13 Python
Flask和Django框架中自定义模型类的表名、父类相关问题分析
Jul 19 Python
在python中使用with打开多个文件的方法
Jan 07 Python
几行Python代码爬取3000+上市公司的信息
Jan 24 Python
Python中正则表达式的用法总结
Feb 22 Python
Python学习笔记基本数据结构之序列类型list tuple range用法分析
Jun 08 Python
Python 进程之间共享数据(全局变量)的方法
Jul 16 Python
谈谈Python:为什么类中的私有属性可以在外部赋值并访问
Mar 05 Python
Python如何输出整数
Jun 07 Python
python 实现rolling和apply函数的向下取值操作
Jun 08 Python
Python爬取你好李焕英豆瓣短评生成词云的示例代码
Feb 24 Python
python isinstance函数用法详解
Feb 13 #Python
Python中的X[:,0]、X[:,1]、X[:,:,0]、X[:,:,1]、X[:,m:n]和X[:,:,m:n]
Feb 13 #Python
基于python的docx模块处理word和WPS的docx格式文件方式
Feb 13 #Python
python 中的[:-1]和[::-1]的具体使用
Feb 13 #Python
Python使用docx模块实现刷题功能代码
Feb 13 #Python
Tensorflow训练MNIST手写数字识别模型
Feb 13 #Python
Python3 读取Word文件方式
Feb 13 #Python
You might like
substr()函数中文版
2006/10/09 PHP
以文本方式上传二进制文件的PHP程序
2006/10/09 PHP
PHP配置心得包含MYSQL5乱码解决
2006/11/20 PHP
在数据量大(超过10万)的情况下
2007/01/15 PHP
PHP 函数执行效率的小比较
2010/10/17 PHP
微信支付的开发流程详解
2016/09/13 PHP
JavaScript中的对象序列化介绍
2014/12/30 Javascript
jQuery替换textarea中换行的方法
2015/06/10 Javascript
基于jQuery实现的无刷新表格分页实例
2016/02/17 Javascript
解决html-jquery/js引用外部图片时遇到看不了或出现403的问题
2017/09/22 jQuery
jQuery实现导航样式布局操作示例【可自定义样式布局】
2018/07/24 jQuery
解决vue接口数据赋值给data没有反应的问题
2018/08/27 Javascript
Node.js模拟发起http请求从异步转同步的5种用法
2018/09/26 Javascript
解决betterScroll在vue中存在图片时,出现拉不动的问题
2018/09/27 Javascript
JS实现的合并两个有序链表算法示例
2019/02/25 Javascript
vue改变对象或数组时的刷新机制的方法总结
2019/04/24 Javascript
vue之debounce属性被移除及处理详解
2019/11/13 Javascript
axios如何取消重复无用的请求详解
2019/12/15 Javascript
Vue常用的全选/反选的示例代码
2020/02/19 Javascript
python利用hook技术破解https的实例代码
2013/03/25 Python
Python实现通过文件路径获取文件hash值的方法
2017/04/29 Python
python写一个md5解密器示例
2018/02/23 Python
Django 实现图片上传和显示过程详解
2019/07/18 Python
pytorch-RNN进行回归曲线预测方式
2020/01/14 Python
python实现磁盘日志清理的示例
2020/11/05 Python
让ie浏览器成为支持html5的浏览器的解决方法(使用html5shiv)
2014/04/08 HTML / CSS
浅谈HTML5中dialog元素尝鲜
2018/10/15 HTML / CSS
HTML5输入框下拉菜单功能的示例代码
2020/09/08 HTML / CSS
法国体育用品商店:GO Sport
2019/10/23 全球购物
如何用PHP实现邮件发送
2012/12/26 面试题
医科学校毕业生自荐信
2013/11/09 职场文书
法院干警四风问题个人对照检查材料思想汇报
2014/10/07 职场文书
滞留工资返还协议书
2014/10/19 职场文书
大雁塔导游词
2015/02/04 职场文书
2016圣诞节贺卡寄语
2015/12/07 职场文书
golang使用map实现去除重复数组
2022/04/14 Golang