基于python爬取有道翻译过程图解


Posted in Python onMarch 31, 2020

1.准备工作

先来到有道在线翻译的界面http://fanyi.youdao.com/

F12 审查元素 ->选Network一栏,然后F5刷新 (如果看不到Method一栏,右键Name栏,选中Method)

基于python爬取有道翻译过程图解

输入文字自动翻译后发现Method一栏有GET还有POST;GET是指从服务器请求和获得数据,POST是向指定服务器提交被处理的数据、

随便打开一个POST,找到preview可以看到我们输入的“我爱你一生一世”数据,可以证明post的提交数据的

基于python爬取有道翻译过程图解

下面分析一下Headers各个字段的意义;User-agent字段很重要

基于python爬取有道翻译过程图解

基于python爬取有道翻译过程图解

下面来看一下request模块中urlopen方法,查看文档;

发现urlopen有一个data参数,如果参数没赋值(默认None)就是GET形式,如果data参数被赋值了,就以POST形式提交

基于python爬取有道翻译过程图解

在这里,data参数其实是一个字典 ;就是源代码中From Data的数据

下面一篇文章是对urlencode与unquote的详细解释:(urllib库里可惜没有urldecode函数)

为什么要进行编码和解码呢?------》对于一些中文或者字符,url是不识别的,需要进行编码转换!encode('utf-8')把unicode的形式变成utf-8decode('utf-8')把utf-8形式变成Unicode编码形式2.下面进行敲!

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python struct.unpack
Sep 06 Python
python里将list中元素依次向前移动一位
Sep 12 Python
Python获取文件所在目录和文件名的方法
Jan 12 Python
python的re模块使用方法详解
Jul 26 Python
Django如何使用第三方服务发送电子邮件
Aug 14 Python
Python socket 套接字实现通信详解
Aug 27 Python
在Python中画图(基于Jupyter notebook的魔法函数)
Oct 28 Python
如何使用python3获取当前路径及os.path.dirname的使用
Dec 13 Python
python 制作简单的音乐播放器
Nov 25 Python
Pytorch1.5.1版本安装的方法步骤
Dec 31 Python
Python实现网络聊天室的示例代码(支持多人聊天与私聊)
Jan 27 Python
Django开发RESTful API实现增删改查(入门级)
May 10 Python
django实现将修改好的新模型写入数据库
Mar 31 #Python
Python urlencode和unquote函数使用实例解析
Mar 31 #Python
Python响应对象text属性乱码解决方案
Mar 31 #Python
django执行数据库查询之后实现返回的结果集转json
Mar 31 #Python
Python super()方法原理详解
Mar 31 #Python
django实现更改数据库某个字段以及字段段内数据
Mar 31 #Python
django rest framework serializer返回时间自动格式化方法
Mar 31 #Python
You might like
PHP中在数据库中保存Checkbox数据(1)
2006/10/09 PHP
计算2000年01月01日起到指定日的天数
2006/10/09 PHP
教你如何在CI框架中使用 .htaccess 隐藏url中index.php
2014/06/09 PHP
PHP中feof()函数实例测试
2014/08/23 PHP
php输入流php://input使用浅析
2014/09/02 PHP
php实现字符串反转输出的方法
2015/03/14 PHP
PHP编程实现微信企业向用户付款的方法示例
2017/07/26 PHP
jQuery中 noConflict() 方法使用
2013/04/25 Javascript
输入自动提示搜索提示功能的使用说明:sugggestion.txt
2013/09/02 Javascript
JS实现网页Div层Clone拖拽效果
2015/09/26 Javascript
jquery 表单验证之通过 class验证表单不为空
2015/11/02 Javascript
Node.js编写爬虫的基本思路及抓取百度图片的实例分享
2016/03/12 Javascript
基于jQuery ligerUI实现分页样式
2016/09/18 Javascript
jQuery中的select操作详解
2016/11/29 Javascript
提高JavaScript执行效率的23个实用技巧
2017/03/01 Javascript
剖析Angular Component的源码示例
2018/03/23 Javascript
javascript之分片上传,断点续传的实际项目实现详解
2019/09/05 Javascript
使用Python保存网页上的图片或者保存页面为截图
2016/03/05 Python
Python在图片中添加文字的两种方法
2017/04/29 Python
基于python socketserver框架全面解析
2017/09/21 Python
Python3学习urllib的使用方法示例
2017/11/29 Python
python 实现对文件夹内的文件排序编号
2018/04/12 Python
纯用NumPy实现神经网络的示例代码
2018/10/24 Python
Python脚本完成post接口测试的实例
2018/12/17 Python
python的re模块使用方法详解
2019/07/26 Python
Win10下python 2.7与python 3.7双环境安装教程图解
2019/10/12 Python
Python PyInstaller安装和使用教程详解
2020/01/08 Python
Windows 平台做 Python 开发的最佳组合(推荐)
2020/07/27 Python
Laura Mercier官网:彩妆大师罗拉玛斯亚的化妆品牌
2018/01/04 全球购物
意大利折扣和优惠券网站:Groupalia
2019/10/09 全球购物
积极分子思想汇报
2014/01/04 职场文书
护理专业学生职业生涯规划范文
2014/03/11 职场文书
助理政工师申报材料
2014/06/03 职场文书
庆七一活动简报
2015/07/20 职场文书
建筑工程挂靠协议书
2016/03/23 职场文书
《岳阳楼记》原文、译文赏析
2019/09/10 职场文书