详解python使用金山词霸的翻译功能(调试工具断点的使用)


Posted in Python onJanuary 07, 2021

今天试着用python获取金山词霸的翻译功能,链接在这里:
ICIBA传送门
打开之后,界面是这样的,还是比较干净的。

详解python使用金山词霸的翻译功能(调试工具断点的使用)

按F12,打开调试工具,选择Network,找到XHR

详解python使用金山词霸的翻译功能(调试工具断点的使用)

这里就是查看网络传输的内容。XHR就是不刷新页面的网络传输,就是常说的ajax(阿贾克斯,像是希腊神话里的名字……)。
然后我们在翻译窗口写点儿内容,然后点翻译

详解python使用金山词霸的翻译功能(调试工具断点的使用)

看,左边的页面出现了翻译结果,右边调试窗口出现了两条数据传输。
两条?那我们选哪条呢?点开看看……
哦,天哪~两条都是一样的,那我们随便选一条就可以了。
点一下,看后面的内容

详解python使用金山词霸的翻译功能(调试工具断点的使用)

好了,首先看到的是Request URL。嗯……就是我们要的URL了。
先记下来……
(你是用复制、粘贴,还是键盘上手打?难道是抄在本子上?)
下面的Post也要记住,这是请求类型,别用成get了。
再往下,

详解python使用金山词霸的翻译功能(调试工具断点的使用)

上面那部分是不是很熟悉?对了,就是URL链接里的东西。不管他,URL里有了就好了。
下面的部分,就是要提交的数据了。
把这部分转成字典格式:

data = {
	'from':'zh'
	'to':'en'
	'q':'风'
}

 

fromto这就好理解了,就是从中文到英文嘛。好,咱们不管他是中是英,都给成“auto”,让他自己去猜去……
q就是我们查的词语,那我们就用变量q表示吧,这样改后的字典就是:

data = {
	'from':'auto'
	'to':'auto'
	'q':q
}

提交的数据有了,那我们把请求头建立起来吧
再让我们回到调试工具里去看下

详解python使用金山词霸的翻译功能(调试工具断点的使用)

headers就是请求头部,那里面这么多东西,我们要用什么呢?
当然**User-Agent:**不能少了

headers = {
  'User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/57.0.2987.98 Safari/537.36 LBBROWSER'
  }

好了,我们需要的东西都齐了,那就开始吧:
首先是引入文件,

import requests

我们再到调试工具里看下返回值,看下获取的内容是什么格式的。一般返回值有json的,也有html的。

详解python使用金山词霸的翻译功能(调试工具断点的使用)

这里把返回的结果给你了,这就是json的数据格式。
我们用q来获取输入的文本

q = input('请输入要翻译的内容:')

整理后就是这样了:

import requests
q = input('请输入要翻译的内容:')
headers = {
 'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_12_0) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/72.0.3626.121 Safari/537.36'
 }
url = 'https://ifanyi.iciba.com/index.php?c=trans&m=fy&client=6&auth_user=key_ciba&sign=c1b23d3ff9163427'
data = {
 'from':'auto',
 'to':'auto',
 'q':q
  }

res = requests.post(url=url,headers=headers,data=data).json()
print(res)

好了,运行一遍试下

详解python使用金山词霸的翻译功能(调试工具断点的使用)

我们输入要翻译的内容,

详解python使用金山词霸的翻译功能(调试工具断点的使用)

不错,结果返回了,是json格式的数据,里面有我们需要的结果。
再换个词试下……

详解python使用金山词霸的翻译功能(调试工具断点的使用)

这是什么情况?为什么错了?
好吧,我们在浏览器里试下

详解python使用金山词霸的翻译功能(调试工具断点的使用)

点开看一下……

详解python使用金山词霸的翻译功能(调试工具断点的使用)

发现了吗?sign不一样……
前一个是什么?

sign=c1b23d3ff9163427'

这个是

sign=4b733a5ea3f4dd5a

sign是动态生成的,怎么办?找生成方法!

详解python使用金山词霸的翻译功能(调试工具断点的使用)

我们看这里……

这是运行的代码的位置,我们点进去……

详解python使用金山词霸的翻译功能(调试工具断点的使用)

上面老长一行了,怎么办?
看左下角的大括号了吗?点下就会有惊喜!

详解python使用金山词霸的翻译功能(调试工具断点的使用)

好棒!已经排列整齐了……
下面就是在这里查找sign的位置了,Ctrl+F,开始搜索

详解python使用金山词霸的翻译功能(调试工具断点的使用)

23个结果,一个个看过去……找找哪个比较像加密的……

详解python使用金山词霸的翻译功能(调试工具断点的使用)

看,这里是对URL进行拼接的。上面就是sign的加密方式
sign后面拼接的是个r,r就是上面的一行算出来的,

r = c()("6key_cibaifanyicjbysdlove1".concat(t.q.replace(/(^\s*)|(\s*$)/g, ""))).toString().substring(0, 16);

你看,这个r就是用一系列字符串拼接起来的,都有什么呢?

1、"6key_cibaifanyicjbysdlove1"
2、t.q.replace(/(^\s*)|(\s*$)/g, "")

第一个简单,就是一串固定的字符串
第二个呢?t.q是什么鬼?我们来找一下……
好,我们在这一行打个断点,就是在前面的行号上点一下。

详解python使用金山词霸的翻译功能(调试工具断点的使用)

看见蓝色的标签了吧,这就是个断点。在运行的时候,运行到这里就会停止,然后把当前状态给你报出来。好了,断点有了,

咱们让点下翻译,让他运行下看看

详解python使用金山词霸的翻译功能(调试工具断点的使用)

运行到断点时,停止了,并将当前的参数显示了出来。把鼠标放在q上……

详解python使用金山词霸的翻译功能(调试工具断点的使用)

所得寺内!原来就是我们要查的词哦……
然后就把他们拼在一起……

"6key_cibaifanyicjbysdlove1"+"云"

可是c()又是什么鬼?好吧,我们看下加密后的结果是什么

详解python使用金山词霸的翻译功能(调试工具断点的使用)

这个字符串是不是很眼熟?很像md5不是吗?
好的,那我们找一个md5加密工具试下,把加密前的字符串拼接起来

"6key_cibaifanyicjbysdlove1云"

然后我们放到md5加密工具里,看结果

详解python使用金山词霸的翻译功能(调试工具断点的使用)

看这里……

详解python使用金山词霸的翻译功能(调试工具断点的使用)

是不是这个?32位加密后的前16位!
我们再验证一下,换一个词查下,我们查下“雨”

详解python使用金山词霸的翻译功能(调试工具断点的使用)

我把字符串拼接好

"6key_cibaifanyicjbysdlove1雨"

放到md5工具里看下

详解python使用金山词霸的翻译功能(调试工具断点的使用)

是不是一样的?好了,我们知道sign的加密规则了,那我们自己就把这个sign加密。
要用到md5,我们就要引用新的文件了

import hashlib

至于md5的用法,可以看下:

import hashlib
 
 
hash = hashlib.md5()#md5对象,md5不能反解,但是加密是固定的,就是关系是一一对应,所以有缺陷,可以被对撞出来
hash.update(bytes('admin',encoding='utf-8'))#要对哪个字符串进行加密,就放这里
print(hash.hexdigest())#拿到加密字符串
# hash2=hashlib.sha384()#不同算法,hashlib很多加密算法
# hash2.update(bytes('admin',encoding='utf-8'))
# print(hash.hexdigest())
 
 
hash3 = hashlib.md5(bytes('abd',encoding='utf-8'))
''' 如果没有参数,所有md5遵守一个规则,生成同一个对应关系,如果加了参数,
就是在原先加密的基础上再加密一层,这样的话参数只有自己知道,防止被撞库,
因为别人永远拿不到这个参数
'''
hash3.update(bytes('admin',encoding='utf-8'))
print(hash3.hexdigest())

然后我们把sign的加密写一下

sign = (hashlib.md5(("6key_cibaifanyicjbysdlove1"+q).encode('utf-8')).hexdigest())[0:16]

再把sign拼接到url上

sign = (hashlib.md5(("6key_cibaifanyicjbysdlove1"+q).encode('utf-8')).hexdigest())[0:16]
url = 'https://ifanyi.iciba.com/index.php?c=trans&m=fy&client=6&auth_user=key_ciba'
url = url+'&sign='+sign

然后我们运行下看看

详解python使用金山词霸的翻译功能(调试工具断点的使用)

一切OK,没问题!
最后我们从返回的json数据里提取出我们要的那部分

rt= res['content']['out']
print('翻译完成:'+rt)

全部代码就是

import requests
import hashlib

q = input('请输入要翻译的内容:')

headers = {
 'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_12_0) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/72.0.3626.121 Safari/537.36'
 }


url = 'https://ifanyi.iciba.com/index.php?c=trans&m=fy&client=6&auth_user=key_ciba'
sign = (hashlib.md5(("6key_cibaifanyicjbysdlove1"+q).encode('utf-8')).hexdigest())[0:16]
url = url+'&sign='+sign

data = {
 'from':'auto',
 'to':'auto',
 'q':q
  }

res = requests.post(url=url,headers=headers,data=data).json()

rt= res['content']['out']
print('翻译完成:'+rt)

运行看下:

详解python使用金山词霸的翻译功能(调试工具断点的使用)

OK,翻译完工!

总结:
post请求的所有data都是已知的,只有url里有一个动态的sign。麻烦的地方就是查找sign的加密方式。
一般情况下,大部分sign的加密都是使用的md5,你只要找到用来加密的字符串就可以了。
使用断点来跟踪运行过程是比较常用的手段,但也不是全都能找到结果的。

到此这篇关于详解python使用金山词霸的翻译功能(调试工具断点的使用)的文章就介绍到这了,更多相关python金山词霸的翻译内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python通过文件头判断文件类型
Oct 30 Python
Go语言基于Socket编写服务器端与客户端通信的实例
Feb 19 Python
linecache模块加载和缓存文件内容详解
Jan 11 Python
对numpy中布尔型数组的处理方法详解
Apr 17 Python
快速解决PyCharm无法引用matplotlib的问题
May 24 Python
Python3实现获取图片文字里中文的方法分析
Dec 13 Python
python实现全盘扫描搜索功能的方法
Feb 14 Python
python代码xml转txt实例
Mar 10 Python
python logging 重复写日志问题解决办法详解
Aug 04 Python
写一个Python脚本下载哔哩哔哩舞蹈区的所有视频
May 31 Python
python实现A*寻路算法
Jun 13 Python
分享7个 Python 实战项目练习
Mar 03 Python
Opencv+Python识别PCB板图片的步骤
Jan 07 #Python
Django使用django-simple-captcha做验证码的实现示例
Jan 07 #Python
python 实现百度网盘非会员上传超过500个文件的方法
Jan 07 #Python
Django权限控制的使用
Jan 07 #Python
详解Django关于StreamingHttpResponse与FileResponse文件下载的最优方法
Jan 07 #Python
Jupyter Notebook添加代码自动补全功能的实现
Jan 07 #Python
jupyter notebook更换皮肤主题的实现
Jan 07 #Python
You might like
phpmyadmin操作流程
2006/10/09 PHP
获得Google PR值的PHP代码
2007/01/28 PHP
php的curl封装类用法实例
2014/11/07 PHP
php的闭包(Closure)匿名函数详解
2015/02/22 PHP
深入理解PHP内核(二)之SAPI探究
2015/11/10 PHP
Laravel使用memcached缓存对文章增删改查进行优化的方法
2016/10/08 PHP
基于php+MySql实现学生信息管理系统实例
2020/08/04 PHP
JavaScript 变量作用域分析
2011/07/04 Javascript
客户端js判断文件类型和文件大小即限制上传大小
2013/11/20 Javascript
jquery form 隐藏的input 选择
2014/04/29 Javascript
javaScript中两个等于号和三个等于号之间的区别介绍
2014/06/27 Javascript
vue项目中的webpack-dev-sever配置方法
2017/12/14 Javascript
微信小程序云开发之云函数详解
2019/05/16 Javascript
在Chrome DevTools中调试JavaScript的实现
2020/04/07 Javascript
js实现双色球效果
2020/08/02 Javascript
[01:32]2016国际邀请赛中国区预选赛IG战队首日赛后采访
2016/06/27 DOTA
python写入xml文件的方法
2015/05/08 Python
python利用matplotlib库绘制饼图的方法示例
2016/12/18 Python
深入理解Python对Json的解析
2017/02/14 Python
python中requests库session对象的妙用详解
2017/10/30 Python
python搭建服务器实现两个Android客户端间收发消息
2018/04/12 Python
Python多重继承的方法解析执行顺序实例分析
2018/05/26 Python
Python设计模式之享元模式原理与用法实例分析
2019/01/11 Python
基于nexus3配置Python仓库过程详解
2020/06/15 Python
详解python UDP 编程
2020/08/24 Python
美国现代家具和家居商店:Apt2B
2016/08/29 全球购物
Hotels.com英国:全球领先的酒店住宿提供商
2019/01/24 全球购物
世界上最受欢迎的钓鱼诱饵:Rapala
2019/05/02 全球购物
匈牙利超级网上商店和优惠:Alza.hu
2019/12/17 全球购物
历史学专业大学生找工作的自我评价
2013/10/16 职场文书
上学迟到的检讨书
2014/01/11 职场文书
计算机数据库专业职业生涯规划书
2014/02/08 职场文书
求职信名称怎么写
2014/05/26 职场文书
师范大学生求职信
2014/06/13 职场文书
上课说话检讨书500字
2014/11/01 职场文书
mysql 体系结构和存储引擎介绍
2022/05/06 MySQL