用Python制作mini翻译器的实现示例


Posted in Python onAugust 17, 2020

1. 实例描述

在平时编程的过程中,会经常在网上翻译一些单词,本文使用Python制作一款翻译小工具,不仅可以自己用,还可以嵌入到程序当中。运行程序,效果如下图所示,在文本框输入英文或中文,单击 翻译 按钮即可翻译,并将翻译内容显示在下面的文本框中。单击 保存 按钮将输入内容和翻译内容保存到文本文件中以便日后复习。单击 清空 按钮,将清除文本框中的内容。

用Python制作mini翻译器的实现示例

2. 技术要点

利用 requests 模块获取 有道词典web 页面的 post 信息,获取需要的内容,通过 tkinter 模块生成窗口界面,使用文件读写方法将内容保存到文本文件中。

2.1 有道词典这样的 JS 混淆加密应该怎么破

嘿嘿嘿,本文需要说说一些爬虫过程中需要斗智斗勇的事情了,这次咱们就来说说关于一些 JS 混淆加密的事。所谓 JS ,就是 JavaScript,一种前端的脚本语言,一般情况下每个网站都需要 JS 来做一些数据交互,页面渲染等一些异步操作。当然,对于反爬的人来说,JS 的用处还可以用来对一些数据进行加密。

今天咱们就以有道词典这个在线翻译的网站为例,看看他们是如何加密请求数据的,以及笔者是如何通过 Python 模拟请求从而获得关键数据的。

点击 此处 打开有道翻译的网站:

用Python制作mini翻译器的实现示例

输入中文然后点击翻译按钮就会翻译出来英文,比如:

用Python制作mini翻译器的实现示例

接着我们打开开发者工具,按下 F12 来抓一下数据,当我们点击翻译的时候,可以看到有了一个请求:

用Python制作mini翻译器的实现示例

点进去看可以发现,POST 请求的地址是:

http://fanyi.youdao.com/translate_o?smartresult=dict&smartresult=rule

用Python制作mini翻译器的实现示例

我们再来看一下请求过去携带的参数是啥:

用Python制作mini翻译器的实现示例

可以看到,还是需要挺多参数的,其中的 i 就是我们要翻译的内容,那简单啊~想要得到翻译后的数据,那么我们直接把请求头和所需参数的值复制一下,然后用 requests 请求一波不就搞定了?运行一波,返回的是错误码。

用Python制作mini翻译器的实现示例

我们再点多几次翻译按钮,然后就可以看到有多次请求。

用Python制作mini翻译器的实现示例

可以发现,每一次的请求中的 saltsignltsbv 参数是会一直变化的。

用Python制作mini翻译器的实现示例

用Python制作mini翻译器的实现示例

我们回到NetWork ,我们看到 Initiator 这一栏,可以看到它请求到了 fanyi.min.js:1 这个 js 文件。

用Python制作mini翻译器的实现示例

我们就点 fanyi.min.js:1 进去看看,牛的一比,直接看不懂…还好,左下角有一个 {} ,可以点一下,发现有惊喜,直接帮我们把压缩的 js 代码格式化。

用Python制作mini翻译器的实现示例

牛逼不,行号都给我们显示出来了,不过到了这里,依然懵逼,我们还是不知道怎么拿到 saltsignltsbv 这些参数的值…咋办?恩,Chrome 浏览器的打断点功能在这个时候就要派上用场。那么如何使用断点功能呢,我们看到 Chrome 的右边是这样的:

用Python制作mini翻译器的实现示例

看到这个 XHR/fetch BreakPoints 没,在这里我们可以添加 url ,根据请求这个 url 打断点。而我们要打的断点就是一开始获取到的请求 url

http://fanyi.youdao.com/translate_o?smartresult=dict&smartresult=rule

点击 XHR/fetch BreakPoints 右边的 + 号,然后把链接复制进去:

用Python制作mini翻译器的实现示例

这时候再点击翻译按钮,突然,你的屏幕一灰,表示好事将近,我们成功打上了断点,也就是说,现在我们可以在请求之前做一些骚操作。

用Python制作mini翻译器的实现示例

这时候我们将右边的 Call Stack 展开,点 t.translate 进去:

用Python制作mini翻译器的实现示例

这些,就是我们在点击翻译按钮之后,会调用到 js 里面的方法,从这里下手,来寻找参数是被如何加密的,

用Python制作mini翻译器的实现示例

用Python制作mini翻译器的实现示例

3. 代码实现

用Python制作mini翻译器的具体步骤如下:

首先安装 requests 模块。使用 pip 命令安装,命令如下:

pip install --user -i http://pypi.douban.com/simple --trusted-host pypi.douban.com requests

导入相关模块,代码如下。

import tkinter as tk
import requests
import time
import hashlib
import random

定义翻译函数,代码如下。

def get_ts():
  """
  获取时间戳
  :return: 时间
  """
  return str(int(time.time() * 1000))


def get_bv():
  """
  获取app版本 并通过md5加密
  :return: 加密后的字符串
  """
  navigator_appVersion = 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3' \
              '904.108 Safari/537.36'
  m = hashlib.md5()
  m.update(navigator_appVersion.encode('utf-8'))
  return m.hexdigest()


def get_salt(ts):
  return str(ts) + str(int(random.random() * 10))


def get_sign(salt):
  str1 = text1.get() # 定义一个变量,用来接收输入文本框的值
  str_data = 'fanyideskweb' + str1 + salt + ']BjuETDhU)zqSxf-=B#7m'
  m = hashlib.md5()
  m.update(str_data.encode('utf-8'))
  return m.hexdigest()


def get_form_data():
  str1 = text1.get() # 定义一个变量,用来接收输入文本框的值
  ts = get_ts()
  salt = get_salt(ts)
  form_data = {
    'i': str1,
    'from': 'AUTO',
    'to': 'AUTO',
    'smartresult': 'dict',
    'client': 'fanyideskweb',
    'salt': str(salt),
    'sign': get_sign(salt),
    'ts': ts,
    'bv': get_bv(),
    'doctype': 'json',
    'version': '2.1',
    'keyfrom': 'fanyi.web',
    'action': 'FY_BY_CLICKBUTTION',
  }
  return form_data


# 定义翻译函数
def translate():
  url = "http://fanyi.youdao.com/translate_o?smartresult=dict&smartresult=rule"
  headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.108 Safari/537.36',
    'Referer': 'http://fanyi.youdao.com/',
    'Cookie': 'OUTFOX_SEARCH_USER_ID_NCOO=173326173.72226533; OUTFOX_SEARCH_USER_ID="-1202396372@10.108.160.18"; DICT_UGC=be3af0da19b5c5e6aa4e17bd8d90b28a|; JSESSIONID=abcAjF-mxbKFQ_48uyLpx; __guid=204659719.1682486053682624500.1597281254731.5474; monitor_count=2; ___rl__test__cookies=1597285713766'
  }
  response = requests.post(url=url, data=get_form_data(), headers=headers)
  if response.status_code == 200:
    result = response.json()
    translate_result = result['translateResult'][0][0]['tgt']
    text2.delete(1.0, "end") # 清空输出文本框
    text2.insert('end', translate_result) # 将翻译结果添加到输出文本框中

定义写入文本 txt 的函数,代码如下。

# 定义写入文本txt的函数
def write():
  f1 = open('translate.txt', 'a+')
  f1.write(text1.get() + ',' + text2.get(0.0, tk.END))

定义清空文本框的函数,代码如下。

# 定义清空文本框的函数
def delete():
  text1.delete(0, "end") # 从第一行清除到最后一行
  text2.delete(1.0, "end")

窗口界面设计,代码如下。

if __name__ == '__main__':
  window = tk.Tk() # 创建window窗口
  window.wm_attributes("-topmost", 1) # 置顶
  window.title("AmoXiang mini翻译器") # 定义窗口名称
  window.resizable(width=False, height=False) # 决定框体大小是否能够调整
  text1 = tk.Entry(window, width=80, bg='whitesmoke') # 在窗体上添加一个输入文本框,并设置尺寸和颜色
  text2 = tk.Text(window, height=18, bg='lightgrey') # 在窗体上添加一个输出文本框,并设置尺寸和颜色
  text1.grid(row=0, sticky="W", padx=1)
  text2.grid(row=1)
  # 添加一个按钮,用于触发翻译功能
  t_button = tk.Button(window, text='翻译', relief=tk.RAISED, width=8, height=1, font='宋体', bg='red', fg='white',
             command=translate)
  # 添加一个按钮,用于触发清空输入文本框
  button1 = tk.Button(window, text='保存', font='宋体', relief=tk.RAISED, width=8, height=1, command=write)
  # 添加一个按钮,用于触发清空输出文本框
  button2 = tk.Button(window, text='清空', font='宋体', relief=tk.RAISED, width=8, height=1, command=delete)
  # 添加背景图片
  image_file = tk.PhotoImage(file='amo.gif')
  label = tk.Label(window, image=image_file)
  # 完成界面布局,设置各个控件的位置
  t_button.grid(row=0, column=1, padx=2)
  button1.grid(row=0, column=2, padx=2)
  button2.grid(row=0, column=3, padx=2)
  label.grid(row=1, column=1, columnspan=3)
  tk.mainloop()

到此这篇关于用Python制作mini翻译器的实现示例的文章就介绍到这了,更多相关Python mini翻译器内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python写入已存在的excel数据实例
May 03 Python
Python 找到列表中满足某些条件的元素方法
Jun 26 Python
Python爬虫实现抓取京东店铺信息及下载图片功能示例
Aug 07 Python
python特性语法之遍历、公共方法、引用
Aug 08 Python
从DataFrame中提取出Series或DataFrame对象的方法
Nov 10 Python
python求加权平均值的实例(附纯python写法)
Aug 22 Python
Python 生成一个从0到n个数字的列表4种方法小结
Nov 28 Python
Python pygame绘制文字制作滚动文字过程解析
Dec 12 Python
Python使用urllib模块对URL网址中的中文编码与解码实例详解
Feb 18 Python
Python基于numpy模块实现回归预测
May 14 Python
python中pow函数用法及功能说明
Dec 04 Python
Python爬取网站图片并保存的实现示例
Feb 26 Python
PyCharm vs VSCode,作为python开发者,你更倾向哪种IDE呢?
Aug 17 #Python
pandas apply多线程实现代码
Aug 17 #Python
简述python Scrapy框架
Aug 17 #Python
python使用多线程查询数据库的实现示例
Aug 17 #Python
python使用建议与技巧分享(一)
Aug 17 #Python
Python2.6版本pip安装步骤解析
Aug 17 #Python
python中pathlib模块的基本用法与总结
Aug 17 #Python
You might like
PHP最常用的ini函数分析 针对PHP.ini配置文件
2010/04/22 PHP
新浪微博API开发简介之用户授权(PHP基础篇)
2011/09/25 PHP
如何使用php判断所处服务器操作系统的类型
2013/06/20 PHP
PHP使用GIFEncoder类处理gif图片实例
2014/07/01 PHP
PHP安装memcached扩展笔记
2015/05/28 PHP
PHP的Yii框架中行为的定义与绑定方法讲解
2016/03/18 PHP
PHP常见字符串处理函数用法示例【转换,转义,截取,比较,查找,反转,切割】
2016/12/24 PHP
Laravel 前端资源配置教程
2019/10/18 PHP
一实用的实现table排序的Javascript类库
2007/09/12 Javascript
JS 的应用开发初探(mootools)
2009/12/19 Javascript
jquery Mobile入门—多页面切换示例学习
2013/01/08 Javascript
解读JavaScript中 For, While与递归的用法
2013/05/07 Javascript
JavaScript实现自动消除按钮功能的方法
2015/08/05 Javascript
jQuery无刷新分页完整实例代码
2015/10/27 Javascript
全面解析JavaScript中的valueOf与toString方法(推荐)
2016/06/14 Javascript
jQuery EasyUI 获取tabs的实例解析
2016/12/06 Javascript
BootStrap Table 后台数据绑定、特殊列处理、排序功能
2017/05/27 Javascript
Angular ng-animate和ng-cookies用法详解
2018/04/18 Javascript
vue数据响应式原理知识点总结
2020/02/16 Javascript
Python生成器(Generator)详解
2015/04/13 Python
探究Python多进程编程下线程之间变量的共享问题
2015/05/05 Python
使用XML库的方式,实现RPC通信的方法(推荐)
2017/06/14 Python
pyqt5 实现工具栏文字图片同时显示
2019/06/13 Python
Django 后台获取文件列表 InMemoryUploadedFile的例子
2019/08/07 Python
python numpy中cumsum的用法详解
2019/10/17 Python
Django添加bootstrap框架时无法加载静态文件的解决方式
2020/03/27 Python
施华洛世奇澳大利亚官网:SWAROVSKI澳大利亚
2017/01/06 全球购物
法国家具及室内配件店:home24
2017/01/21 全球购物
台湾三立电视电商平台:电电购
2019/09/09 全球购物
财务经理岗位职责
2013/11/09 职场文书
小学生红领巾广播稿
2014/01/21 职场文书
学习张丽丽心得体会
2014/09/03 职场文书
学生检讨书怎么写?
2014/10/10 职场文书
十二生肖观后感
2015/06/12 职场文书
餐厅如何利用“营销策略”扭转亏本局面
2019/10/15 职场文书
再谈python_tkinter弹出对话框创建
2022/03/20 Python