利用python爬取有道词典的方法


Posted in Python onDecember 08, 2020

前言

大家好

​ 最近python爬虫有点火啊,啥python爬取马保国视频……我也来凑个热闹,今天我们来试着做个翻译软件……不是不是,说错了,今天我们来试着提交翻译内容并爬取翻译结果

主要内容

 材料

1.Python 3.8.4

2.电脑一台(应该不至于有”穷苦人家“连一台电脑都没有吧)

3.Google浏览器(其他的也行,但我是用的Google)

写程序前准备

打开Google浏览器,找的有道词典的翻译网页(http://fanyi.youdao.com/)

打开后摁F12打开开发者模式,找Network选项卡,点击Network选项卡,然后刷新一下网页

然后翻译一段文字,随便啥都行(我用的程序员的传统:hello world),然后点击翻译

在选项卡中找到以translate开头的post文件

利用python爬取有道词典的方法

箭头的地方才是真正的提交地址

记住他,写代码时要用

利用python爬取有道词典的方法

这个是提交电脑的基本信息,记住他,等会儿要用,等会儿伪装成电脑时可以用,因为电脑会有基本信息,而如果是python的话会显示成python3.8.4(因为我的版本是3.8.4),从而容易被服务器禁入

利用python爬取有道词典的方法

等会儿还要用

好,准备工作做完了,接下来开始干正事了

开始编写爬虫代码

下面是我写的代码,具体我就不细说了

#导入urllib库
import urllib.request
import urllib.parse
import json

while True: #无限循环
 content = input("请输入您要翻译的内容(输入 !!! 退出程序): ")
 #设置退出条件
 if content == '!!!':
  break

 url = 'http://fanyi.youdao.com/translate?smartresult=dict&smartresult=rule' #选择要爬取的网页,上面找过了
 #加上一个帽子,减少被发现的概率(下面head列表的内容就是上面找的)
 head = {}
 head['User - Agent'] = '请替换'

 #伪装计算机提交翻译申请(下面的内容也在在上面有过,最好根据自己的进行修改)
 data = {}
 data['type'] = 'AUTO'
 data['i'] = content
 data['doctype'] = 'json'
 data['version'] = '2.1'
 data['keyfrom:'] = 'fanyi.web'
 data['ue'] = 'UTF-8'
 data['typoResult'] = 'true'
 data = urllib.parse.urlencode(data).encode('utf-8')

 response = urllib.request.urlopen(url, data)
 #解码
 html = response.read().decode('utf-8')

 paper = json.loads(html)

 #打印翻译结果
 print("翻译结果: %s" % (paper['translateResult'][0][0]['tgt']))

运行结果

利用python爬取有道词典的方法

到此这篇关于python爬取有道词典的文章就介绍到这了,更多相关python有道词典内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python读写ini配置文件方法实例分析
Jun 30 Python
简介二分查找算法与相关的Python实现示例
Aug 26 Python
Python脚本实时处理log文件的方法
Nov 21 Python
PyQt5每天必学之工具提示功能
Apr 19 Python
使用Python实现一个栈判断括号是否平衡
Aug 23 Python
python 美化输出信息的实例
Oct 15 Python
python3 unicode列表转换为中文的实例
Oct 26 Python
python读取csv和txt数据转换成向量的实例
Feb 12 Python
python实现电子词典
Mar 03 Python
Django自定义全局403、404、500错误页面的示例代码
Mar 08 Python
python中wheel的用法整理
Jun 15 Python
python实例化对象的具体方法
Jun 17 Python
Python控制鼠标键盘代码实例
Dec 08 #Python
Pycharm-community-2020.2.3 社区版安装教程图文详解
Dec 08 #Python
解决pycharm导入numpy包的和使用时报错:RuntimeError: The current Numpy installation (‘D:\\python3.6\\lib\\site-packa的问题
Dec 08 #Python
Python爬虫之App爬虫视频下载的实现
Dec 08 #Python
Python爬虫进阶之爬取某视频并下载的实现
Dec 08 #Python
selenium框架中driver.close()和driver.quit()关闭浏览器
Dec 08 #Python
Python hashlib和hmac模块使用方法解析
Dec 08 #Python
You might like
PHP利用COM对象访问SQLServer、Access
2006/10/09 PHP
php cli模式学习(PHP命令行模式)
2013/06/03 PHP
php生成zip压缩文件的方法详解
2013/06/09 PHP
php实现点击可刷新验证码
2015/11/07 PHP
Yii2框架实现注册和登录教程
2016/09/30 PHP
浅谈Javascript嵌套函数及闭包
2010/11/09 Javascript
基于jQuery的输入框无值自动显示指定数据的实现代码
2011/01/24 Javascript
JavaScript实现两个Table固定表头根据页面大小自行调整
2014/01/03 Javascript
用Node.js通过sitemap.xml批量抓取美女图片
2015/05/28 Javascript
javascript插件开发的一些感想和心得
2016/02/28 Javascript
Node.js Streams文件读写操作详解
2016/07/04 Javascript
JS获取当前页面名称的简单实例
2016/08/19 Javascript
js控制li的隐藏和显示实例代码
2016/10/15 Javascript
Vue键盘事件用法总结
2017/04/18 Javascript
详解Vue中localstorage和sessionstorage的使用
2017/12/22 Javascript
JavaScript创建防篡改对象的方法分析
2018/12/30 Javascript
webpack打包优化的几个方法总结
2020/02/10 Javascript
vue props default Array或是Object的正确写法说明
2020/07/30 Javascript
Python警察与小偷的实现之一客户端与服务端通信实例
2014/10/09 Python
Python中实现常量(Const)功能
2015/01/28 Python
简介Django中内置的一些中间件
2015/07/24 Python
Python二叉树的定义及常用遍历算法分析
2017/11/24 Python
python 接口返回的json字符串实例
2018/03/27 Python
wxPython多个窗口的基本结构
2019/11/19 Python
Pytorch 使用CNN图像分类的实现
2020/06/16 Python
Python环境使用OpenCV检测人脸实现教程
2020/10/19 Python
大学毕业生简单自荐信
2013/11/05 职场文书
大学军训自我鉴定
2013/12/15 职场文书
欢送退休感言
2014/02/08 职场文书
卫生院艾滋病宣传活动小结
2014/07/09 职场文书
三年级学生期末评语
2014/12/26 职场文书
农村环境卫生倡议书
2015/04/29 职场文书
运动会新闻稿
2015/07/17 职场文书
关于应聘教师的自荐信
2016/01/28 职场文书
实现AJAX异步调用和局部刷新的基本步骤
2022/03/17 Javascript
Python获取字典中某个key的value
2022/04/13 Python