利用python爬取有道词典的方法


Posted in Python onDecember 08, 2020

前言

大家好

​ 最近python爬虫有点火啊,啥python爬取马保国视频……我也来凑个热闹,今天我们来试着做个翻译软件……不是不是,说错了,今天我们来试着提交翻译内容并爬取翻译结果

主要内容

 材料

1.Python 3.8.4

2.电脑一台(应该不至于有”穷苦人家“连一台电脑都没有吧)

3.Google浏览器(其他的也行,但我是用的Google)

写程序前准备

打开Google浏览器,找的有道词典的翻译网页(http://fanyi.youdao.com/)

打开后摁F12打开开发者模式,找Network选项卡,点击Network选项卡,然后刷新一下网页

然后翻译一段文字,随便啥都行(我用的程序员的传统:hello world),然后点击翻译

在选项卡中找到以translate开头的post文件

利用python爬取有道词典的方法

箭头的地方才是真正的提交地址

记住他,写代码时要用

利用python爬取有道词典的方法

这个是提交电脑的基本信息,记住他,等会儿要用,等会儿伪装成电脑时可以用,因为电脑会有基本信息,而如果是python的话会显示成python3.8.4(因为我的版本是3.8.4),从而容易被服务器禁入

利用python爬取有道词典的方法

等会儿还要用

好,准备工作做完了,接下来开始干正事了

开始编写爬虫代码

下面是我写的代码,具体我就不细说了

#导入urllib库
import urllib.request
import urllib.parse
import json

while True: #无限循环
 content = input("请输入您要翻译的内容(输入 !!! 退出程序): ")
 #设置退出条件
 if content == '!!!':
  break

 url = 'http://fanyi.youdao.com/translate?smartresult=dict&smartresult=rule' #选择要爬取的网页,上面找过了
 #加上一个帽子,减少被发现的概率(下面head列表的内容就是上面找的)
 head = {}
 head['User - Agent'] = '请替换'

 #伪装计算机提交翻译申请(下面的内容也在在上面有过,最好根据自己的进行修改)
 data = {}
 data['type'] = 'AUTO'
 data['i'] = content
 data['doctype'] = 'json'
 data['version'] = '2.1'
 data['keyfrom:'] = 'fanyi.web'
 data['ue'] = 'UTF-8'
 data['typoResult'] = 'true'
 data = urllib.parse.urlencode(data).encode('utf-8')

 response = urllib.request.urlopen(url, data)
 #解码
 html = response.read().decode('utf-8')

 paper = json.loads(html)

 #打印翻译结果
 print("翻译结果: %s" % (paper['translateResult'][0][0]['tgt']))

运行结果

利用python爬取有道词典的方法

到此这篇关于python爬取有道词典的文章就介绍到这了,更多相关python有道词典内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python正则表达式抓取成语网站
Nov 20 Python
以一段代码为实例快速入门Python2.7
Mar 31 Python
python使用in操作符时元组和数组的区别分析
May 19 Python
Python设计模式之命令模式简单示例
Jan 10 Python
用Python写脚本,实现完全备份和增量备份的示例
Apr 29 Python
python和shell监控linux服务器的详细代码
Jun 22 Python
python如何实现一个刷网页小程序
Nov 27 Python
Python3爬虫全国地址信息
Jan 05 Python
把pandas转换int型为str型的方法
Jan 29 Python
在pytorch中为Module和Tensor指定GPU的例子
Aug 19 Python
python实现图片插入文字
Nov 26 Python
利用Python将list列表写入文件并读取的方法汇总
Mar 25 Python
Python控制鼠标键盘代码实例
Dec 08 #Python
Pycharm-community-2020.2.3 社区版安装教程图文详解
Dec 08 #Python
解决pycharm导入numpy包的和使用时报错:RuntimeError: The current Numpy installation (‘D:\\python3.6\\lib\\site-packa的问题
Dec 08 #Python
Python爬虫之App爬虫视频下载的实现
Dec 08 #Python
Python爬虫进阶之爬取某视频并下载的实现
Dec 08 #Python
selenium框架中driver.close()和driver.quit()关闭浏览器
Dec 08 #Python
Python hashlib和hmac模块使用方法解析
Dec 08 #Python
You might like
一个php作的文本留言本的例子(三)
2006/10/09 PHP
CI框架中libraries,helpers,hooks文件夹详细说明
2014/06/10 PHP
PHP答题类应用接口实例
2015/02/09 PHP
php post换行的方法
2020/02/03 PHP
用JS操作FRAME中的IFRAME及其内容的实现代码
2008/07/26 Javascript
js每次Title显示不同的名言
2008/09/25 Javascript
BOOTSTRAP时间控件显示在模态框下面的bug修复
2015/02/05 Javascript
PHP+mysql+Highcharts生成饼状图
2015/05/04 Javascript
纯js实现无限空间大小的本地存储
2015/06/18 Javascript
四种参数传递的形式——URL,超链接,js,form表单
2015/07/24 Javascript
详解基于Bootstrap扁平化的后台框架Ace
2015/11/27 Javascript
javascript字符串函数汇总
2015/12/06 Javascript
适用于javascript开发者的Processing.js入门教程
2016/02/24 Javascript
AngularJS表达式讲解及示例代码
2016/08/16 Javascript
vue.js实现请求数据的方法示例
2017/02/07 Javascript
jQuery实现动态添加节点与遍历节点功能示例
2017/11/09 jQuery
分析JS单线程异步io回调的特性
2017/12/01 Javascript
全面介绍vue 全家桶和项目实例
2017/12/27 Javascript
详解Immutable及 React 中实践
2018/03/01 Javascript
JS将网址url转化为JSON格式的方法
2018/07/02 Javascript
vue: WebStorm设置快速编译运行的方法
2018/10/18 Javascript
jQuery实现动态添加和删除input框代码实例
2019/03/29 jQuery
学习python (2)
2006/10/31 Python
python3 property装饰器实现原理与用法示例
2019/05/15 Python
解决Django Static内容不能加载显示的问题
2019/07/28 Python
对tensorflow中cifar-10文档的Read操作详解
2020/02/10 Python
django rest framework使用django-filter用法
2020/07/15 Python
越南综合购物网站:Lazada越南
2019/06/10 全球购物
澳洲网红粉泥面膜:Sand & Sky
2019/08/13 全球购物
英国比较机场停车场网站:Airport Parking Essentials
2019/12/01 全球购物
美丽乡村建设实施方案
2014/03/23 职场文书
汽车促销活动方案
2014/03/31 职场文书
寒假家长评语大全
2014/04/16 职场文书
爱鸟护鸟的宣传语
2015/07/13 职场文书
运动会新闻稿
2015/07/17 职场文书
漫画「古见同学有交流障碍症」第25卷封面公开
2022/03/21 日漫