浅析Python 实现一个自动化翻译和替换的工具


Posted in Python onApril 14, 2019

一个可能你似曾相识的场景

阅读内容包含大量英文的 PPT、Word、Excel 或者记事本时,由于英语不熟悉,为了流利地阅读,需要打开浏览器进入谷歌翻译的主界面,然后把英文复制到谷歌翻译的输入框中,最后又把翻译结果复制回 PPT、Word 和 Excel。

浅析Python 实现一个自动化翻译和替换的工具

浅析Python 实现一个自动化翻译和替换的工具

要是一个两个单词还好,要是发现有 100 个单词不认识,就必须复制粘贴 200 次,如此机械性重复性的工作,应该交给程序来做,这就是我设计下面这个自动化翻译工具的初衷。

提升办公效率的法宝

浅析Python 实现一个自动化翻译和替换的工具

如上图所示,运行程序并保持后台运行,在电脑上的任何一个软件中选择一段文本,并 Ctrl + C 复制到系统剪贴板中,程序就会自动帮助我们完成翻译,并将翻译结果自动复制到系统剪贴版中,只需 Ctrl + V,就完成了翻译结果对原文的替换。

编码实现

程序主要分为两部分,第一部分为谷歌翻译爬虫,第二部分就是实现这个将翻译结果自动替换的业务逻辑。

谷歌翻译爬虫

通过浏览器 F12 开发者工具,很容易定位到翻译请求的URL:http://translate.google.cn/translate_a/single?client=t&sl=en&tl=zh-CN&hl=zh-CN&dt=at&dt=bd&dt=ex&dt=ld&dt=md&dt=qca&dt=rw&dt=rm&dt=ss &dt=t&ie=UTF-8&oe=UTF-8&clearbtn=1&otf=1&pc=1&srcrom=0&ssel=0&tsel=0&kc=2

这个请求接受两个参数,一个就是我们要翻译的字符串 q,另一个是用于用户认证的 tk(token),其中 q 很容易构造,tk 的构造就需要花费一番心力了,需要我们调试 js 代码,这里参考 Github 上大神的轮子: https://github.com/cocoa520/Google_TK

谷歌翻译爬虫的主要代码如下:

def translate(tk, content): 
 if len(content) > 4891: 
  print("too long to translate")
   return 
 param = {'tk': tk, 'q': content} 
 result = requests.get("""http://translate.google.cn/translate_a/single?client=t&sl=en  
&tl=zh-CN&hl=zh-CN&dt=at&dt=bd&dt=ex&dt=ld&dt=md&dt=qca&dt=rw&dt=rm&dt=ss  
 &dt=t&ie=UTF-8&oe=UTF-8&clearbtn=1&otf=1&pc=1&srcrom=0&ssel=0&tsel=0&kc=2""", params=param) 
data = result.json()
 print(data[0][0][0])

返回结果是 json 形式的,翻译结果保存在结果的第一个元组中。

Python 操作系统剪贴板

将读取剪贴板的内容的代码封装成函数如下:

def getText():#读取剪切板
  # 打开剪贴板
  w.OpenClipboard()
 # 读取剪贴板的内容 
 d = w.GetClipboardData(win32con.CF_TEXT)
  # 关闭剪贴板
  w.CloseClipboard()
 try:  
return d.decode('utf-8')
 except:  
 return d.decode('gbk')

返回值 d 是字节类型的,需要解码,中文按 gbk 格式解码,英文按 utf-8 解码。

类似地,写入剪贴板的代码如下:

def setText(aString):#写入剪切板
 # 打开剪贴板
 w.OpenClipboard()
 # 清空剪贴板
 w.EmptyClipboard()
 # 写入剪贴板
 w.SetClipboardText(aString)
 # 关闭剪贴板
 w.CloseClipboard()

实现将翻译结果自动替换原文的逻辑的代码如下:

while(True):
   # 如果剪贴板正在被占用 
  try:
   cs = getText() 
  except: 
   time.sleep(1)
    cs = getText() 
  print('cs',cs) 
  if cs and cs != ls:
   print('准备翻译')
   content = getText()  
 tk = js.getTk(content)
   res = translate(tk, content)14   setText(res)
   time.sleep(1)
   ls = res

值得注意的是,系统剪贴板对象是单例模式的,在操作系统范围内只有一个,而且读写剪贴板都是互斥的,在读(写)剪贴板的同时不允许任何对剪贴板的写(读)操作。试想这样一种情景,我们在其他软件中 Ctrl + C 写入剪贴板,而此时我们的程序代码正好执行到读剪贴板那一行,毫无疑问会报错,我的解决办法是使用 try…except 语句延时 1 s再读取,这样可以大大降低读写碰撞的概率,但无疑消耗了程序性能。

总结

以上所述是小编给大家介绍的Python 实现一个自动化翻译和替换的工具,希望对大家有所帮助,如果大家有任何疑问欢迎给我留言,小编会及时回复大家!

Python 相关文章推荐
python提取内容关键词的方法
Mar 16 Python
Python网络爬虫项目:内容提取器的定义
Oct 25 Python
python实现简单聊天应用 python群聊和点对点均实现
Sep 14 Python
python基于ID3思想的决策树
Jan 03 Python
Python程序员面试题 你必须提前准备!(答案及解析)
Jan 23 Python
Python实现爬虫设置代理IP和伪装成浏览器的方法分享
May 07 Python
python使用代理ip访问网站的实例
May 07 Python
python退出命令是什么?详解python退出方法
Dec 10 Python
Python判断远程服务器上Excel文件是否被人打开的方法
Jul 13 Python
python中slice参数过长的处理方法及实例
Dec 15 Python
Python 虚拟环境工作原理解析
Dec 24 Python
Python爬虫入门教程01之爬取豆瓣Top电影
Jan 24 Python
提升Python程序性能的7个习惯
Apr 14 #Python
Python根据当前日期取去年同星期日期
Apr 14 #Python
Python实现的微信支付方式总结【三种方式】
Apr 13 #Python
Python实现合并excel表格的方法分析
Apr 13 #Python
Python Image模块基本图像处理操作小结
Apr 13 #Python
python使用pymongo操作mongo的完整步骤
Apr 13 #Python
Python实现去除图片中指定颜色的像素功能示例
Apr 13 #Python
You might like
php 按指定元素值去除数组元素的实现方法
2011/11/04 PHP
php daddslashes()和 saddslashes()有哪些区别分析
2012/10/26 PHP
PHP输出九九乘法表代码实例
2015/03/27 PHP
php结合mysql与mysqli扩展处理事务的方法
2016/06/29 PHP
php ajax数据传输和响应方法
2018/08/21 PHP
var与Javascript变量隐式声明
2009/09/17 Javascript
利用Jquery实现可多选的下拉框
2014/02/21 Javascript
bootstrap提示标签、提示框实现代码
2016/12/28 Javascript
jQuery、zepto、js常用小技巧
2017/02/12 Javascript
js以及jquery实现手风琴效果
2020/04/17 Javascript
Vue的事件响应式进度条组件实例详解
2018/02/04 Javascript
D3.js实现拓扑图的示例代码
2018/06/30 Javascript
jQuery弹框插件使用方法详解
2020/05/26 jQuery
React实现todolist功能
2020/12/28 Javascript
微信小程序实现简单购物车功能
2020/12/30 Javascript
Python爬虫DOTA排行榜爬取实例(分享)
2017/06/13 Python
pandas数据分组和聚合操作方法
2018/04/11 Python
对python pandas读取剪贴板内容的方法详解
2019/01/24 Python
Python Gitlab Api 使用方法
2019/08/28 Python
浅谈在django中使用filter()(即对QuerySet操作)时踩的坑
2020/03/31 Python
python 画图 图例自由定义方式
2020/04/17 Python
Python使用Numpy模块读取文件并绘制图片
2020/05/13 Python
Python pandas 列转行操作详解(类似hive中explode方法)
2020/05/18 Python
matplotlib.pyplot.matshow 矩阵可视化实例
2020/06/16 Python
美国Randolph太阳镜官网:美国制造的飞行员太阳镜和射击眼镜
2018/06/15 全球购物
波兰补充商店:Muscle Power
2018/10/29 全球购物
Bonprix法国:时尚、鞋子、家居
2020/12/29 全球购物
Java语言的优势
2015/01/10 面试题
夜大毕业生自我评价分享
2013/11/10 职场文书
年度献血先进个人事迹材料
2014/02/14 职场文书
机械专业技术员求职信
2014/06/14 职场文书
教师节标语大全
2014/10/07 职场文书
有关浪费资源的建议书
2015/09/14 职场文书
干部作风纪律整顿心得体会
2016/01/23 职场文书
劳动合同变更协议书范本
2019/04/18 职场文书
2019年感恩励志演讲稿(收藏备用)
2019/09/11 职场文书