利用python爬取有道词典的方法


Posted in Python onDecember 08, 2020

前言

大家好

​ 最近python爬虫有点火啊,啥python爬取马保国视频……我也来凑个热闹,今天我们来试着做个翻译软件……不是不是,说错了,今天我们来试着提交翻译内容并爬取翻译结果

主要内容

 材料

1.Python 3.8.4

2.电脑一台(应该不至于有”穷苦人家“连一台电脑都没有吧)

3.Google浏览器(其他的也行,但我是用的Google)

写程序前准备

打开Google浏览器,找的有道词典的翻译网页(http://fanyi.youdao.com/)

打开后摁F12打开开发者模式,找Network选项卡,点击Network选项卡,然后刷新一下网页

然后翻译一段文字,随便啥都行(我用的程序员的传统:hello world),然后点击翻译

在选项卡中找到以translate开头的post文件

利用python爬取有道词典的方法

箭头的地方才是真正的提交地址

记住他,写代码时要用

利用python爬取有道词典的方法

这个是提交电脑的基本信息,记住他,等会儿要用,等会儿伪装成电脑时可以用,因为电脑会有基本信息,而如果是python的话会显示成python3.8.4(因为我的版本是3.8.4),从而容易被服务器禁入

利用python爬取有道词典的方法

等会儿还要用

好,准备工作做完了,接下来开始干正事了

开始编写爬虫代码

下面是我写的代码,具体我就不细说了

#导入urllib库
import urllib.request
import urllib.parse
import json

while True: #无限循环
 content = input("请输入您要翻译的内容(输入 !!! 退出程序): ")
 #设置退出条件
 if content == '!!!':
  break

 url = 'http://fanyi.youdao.com/translate?smartresult=dict&smartresult=rule' #选择要爬取的网页,上面找过了
 #加上一个帽子,减少被发现的概率(下面head列表的内容就是上面找的)
 head = {}
 head['User - Agent'] = '请替换'

 #伪装计算机提交翻译申请(下面的内容也在在上面有过,最好根据自己的进行修改)
 data = {}
 data['type'] = 'AUTO'
 data['i'] = content
 data['doctype'] = 'json'
 data['version'] = '2.1'
 data['keyfrom:'] = 'fanyi.web'
 data['ue'] = 'UTF-8'
 data['typoResult'] = 'true'
 data = urllib.parse.urlencode(data).encode('utf-8')

 response = urllib.request.urlopen(url, data)
 #解码
 html = response.read().decode('utf-8')

 paper = json.loads(html)

 #打印翻译结果
 print("翻译结果: %s" % (paper['translateResult'][0][0]['tgt']))

运行结果

利用python爬取有道词典的方法

到此这篇关于python爬取有道词典的文章就介绍到这了,更多相关python有道词典内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
Python解析json之ValueError: Expecting property name enclosed in double quotes: line 1 column 2(char 1)
Jul 06 Python
Python实现的自定义多线程多进程类示例
Mar 23 Python
PyQt5内嵌浏览器注入JavaScript脚本实现自动化操作的代码实例
Feb 13 Python
情人节快乐! python绘制漂亮玫瑰
Aug 18 Python
Python Matplotlib 基于networkx画关系网络图
Jul 10 Python
python+numpy实现的基本矩阵操作示例
Jul 19 Python
python 表格打印代码实例解析
Oct 12 Python
Python 内置变量和函数的查看及说明介绍
Dec 25 Python
Python对称的二叉树多种思路实现方法
Feb 28 Python
Django中从mysql数据库中获取数据传到echarts方式
Apr 07 Python
Keras 使用 Lambda层详解
Jun 10 Python
代码复现python目标检测yolo3详解预测
May 06 Python
Python控制鼠标键盘代码实例
Dec 08 #Python
Pycharm-community-2020.2.3 社区版安装教程图文详解
Dec 08 #Python
解决pycharm导入numpy包的和使用时报错:RuntimeError: The current Numpy installation (‘D:\\python3.6\\lib\\site-packa的问题
Dec 08 #Python
Python爬虫之App爬虫视频下载的实现
Dec 08 #Python
Python爬虫进阶之爬取某视频并下载的实现
Dec 08 #Python
selenium框架中driver.close()和driver.quit()关闭浏览器
Dec 08 #Python
Python hashlib和hmac模块使用方法解析
Dec 08 #Python
You might like
PHP创建单例后台进程的方法示例
2017/05/23 PHP
wordpress自定义标签云与随机获取标签的方法详解
2019/03/22 PHP
关于laravel框架中的常用目录路径函数
2019/10/23 PHP
jQuery中调用WebService方法小结
2011/03/28 Javascript
Javascript实现的常用算法(如冒泡、快速、鸽巢、奇偶等)
2014/04/29 Javascript
javascript使用window.open提示“已经计划系统关机”的原因
2014/08/15 Javascript
js和jquery如何获取图片真实的宽度和高度
2014/09/28 Javascript
jQuery中toggleClass()方法用法实例
2015/01/05 Javascript
JavaScript动态设置div的样式的方法
2015/12/26 Javascript
JavaScript比较当前时间是否在指定时间段内的方法
2016/08/02 Javascript
Angular.js中ng-if、ng-show和ng-hide的区别介绍
2017/01/20 Javascript
Vue 2.X的状态管理vuex记录详解
2017/03/23 Javascript
JavaScript实现AOP详解(面向切面编程,装饰者模式)
2017/12/19 Javascript
浅谈一种让小程序支持JSX语法的新思路
2019/06/16 Javascript
Vue element-ui父组件控制子组件的表单校验操作
2020/07/17 Javascript
python使用xmlrpc实例讲解
2013/12/17 Python
python基于queue和threading实现多线程下载实例
2014/10/08 Python
浅谈python中列表、字符串、字典的常用操作
2017/09/19 Python
python实现按长宽比缩放图片
2018/06/07 Python
python中实现字符串翻转的方法
2018/07/11 Python
Python中捕获键盘的方式详解
2019/03/28 Python
python数据类型之间怎么转换技巧分享
2019/08/20 Python
Python退出时强制运行一段代码的实现方法
2020/04/29 Python
Python3爬虫里关于Splash负载均衡配置详解
2020/07/10 Python
基于python实现图片转字符画代码实例
2020/09/04 Python
pycharm-professional-2020.1下载与激活的教程
2020/09/21 Python
Keds官方网站:购买帆布运动鞋和经典皮鞋
2016/11/12 全球购物
纪伊国屋泰国网上书店:Kinokuniya泰国
2017/12/24 全球购物
医学毕业生自荐信
2013/10/11 职场文书
银行实习鉴定
2013/12/13 职场文书
期末自我鉴定
2014/02/02 职场文书
药店主任岗位责任制
2014/02/10 职场文书
文明旅游倡议书
2015/04/28 职场文书
2015年班主任德育工作总结
2015/05/21 职场文书
初中家长意见
2015/06/03 职场文书
Nginx虚拟主机的搭建的实现步骤
2022/01/18 Servers