Python使用requests模块爬取百度翻译


Posted in Python onAugust 25, 2020

requests模块:

python中原生的一款基于网络请求的模块,功能非常强大,简单便捷,效率极高。

作用:模拟浏览器发请求。

提示:老版使用 urllib模块,但requests比urllib模块要简单好用,现在学习requests模块即可!

requests模块编码流程

指定url

1.1 UA伪装

1.2 请求参数的处理

2.发起请求

3.获取响应数据

4.持久化存储

环境安装:

pip install requests

案例一:破解百度翻译(post请求)

1.代码如下:

#爬取百度翻译
#导入模块
import requests
import json

#UA伪装:将对应的User-Agent封装到一个字典中
headers = {
    'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) '
           'Chrome/57.0.2987.98 Safari/537.36'}

  #网页访问连接
 url='https://fanyi.baidu.com/sug'
 #处理url携带的参数:封装到字典中
word=input("input a word: ")
data={
  'kw': word
}

#请求发送
res=requests.post(url=url,data=data,headers=headers)
#获取响应数据:json()方法返回的是obj(如果确认响应数据是json类型的,才可以使用json())
dic_obj=res.json()

#持久化存储
filename=word+'.json'
fp=open(filename,'w',encoding='utf-8')
json.dump(dic_obj,fp=fp,ensure_ascii=False)

#打印完成提示
print('finish')

其中:

https://fanyi.baidu.com/sug 这个url的定位如下图:

Python使用requests模块爬取百度翻译

2.运行结果

Python使用requests模块爬取百度翻译

Python使用requests模块爬取百度翻译

案例二:爬取搜狗页面数据(get请求)

1.代码如下

import requests
if __name__ == "__main__":
  #step_1:指定url
  url = 'https://www.sogou.com/'
  #step_2:发起请求
  #get方法会返回一个响应对象
  response = requests.get(url=url)
  #step_3:获取响应数据.text返回的是字符串形式的响应数据
  page_text = response.text
  print(page_text)
  #step_4:持久化存储
  with open('./sogou.html','w',encoding='utf-8') as fp:
    fp.write(page_text)
  print('爬取数据结束!!!')

2.运行结果如下:

Python使用requests模块爬取百度翻译

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
利用python获得时间的实例说明
Mar 25 Python
纯Python开发的nosql数据库CodernityDB介绍和使用实例
Oct 23 Python
使用IPython下的Net-SNMP来管理类UNIX系统的教程
Apr 15 Python
21行Python代码实现拼写检查器
Jan 25 Python
python将unicode转为str的方法
Jun 21 Python
python-opencv在有噪音的情况下提取图像的轮廓实例
Aug 30 Python
代码分析Python地图坐标转换
Feb 08 Python
解决pycharm 工具栏Tool中找不到Run manager.py Task的问题
Jul 01 Python
使用tensorflow实现矩阵分解方式
Feb 07 Python
python修改linux中文件(文件夹)的权限属性操作
Mar 05 Python
更新升级python和pip版本后不生效的问题解决
Apr 17 Python
运行python提示no module named sklearn的解决方法
Nov 29 Python
Python爬虫使用bs4方法实现数据解析
Aug 25 #Python
Python+Opencv身份证号码区域提取及识别实现
Aug 25 #Python
Python Selenium实现无可视化界面过程解析
Aug 25 #Python
一文读懂Python 枚举
Aug 25 #Python
详解python变量与数据类型
Aug 25 #Python
python获取百度热榜链接的实例方法
Aug 25 #Python
利用Python如何制作贪吃蛇及AI版贪吃蛇详解
Aug 24 #Python
You might like
PHP简介
2006/10/09 PHP
一个经典实用的PHP图像处理类分享
2014/11/18 PHP
修改WordPress中文章编辑器的样式的方法详解
2015/12/15 PHP
Yii2创建表单(ActiveForm)方法详解
2016/07/23 PHP
PHP基于迭代实现文件夹复制、删除、查看大小等操作的方法
2017/08/11 PHP
javascript的日期对象、数组对象、二维数组使用说明
2014/12/22 Javascript
NodeJS学习笔记之FS文件模块
2015/01/13 NodeJs
Bootstrap 组件之按钮(二)
2016/05/11 Javascript
jQuery获取多种input值的简单实现方法
2016/06/20 Javascript
浅谈js多维数组和hash数组定义和使用
2016/07/27 Javascript
Angular4.x通过路由守卫进行路由重定向实现根据条件跳转到相应的页面(推荐)
2018/05/10 Javascript
vue微信分享的实现(在当前页面分享其他页面)
2019/04/16 Javascript
详解vue 在移动端体验上的优化解决方案
2019/05/20 Javascript
vue-cli在 history模式下的配置详解
2019/11/26 Javascript
[42:32]DOTA2上海特级锦标赛B组资格赛#2 Fnatic VS Spirit第二局
2016/02/27 DOTA
[49:41]NB vs NAVI Supermajor小组赛A组 BO3 第一场 6.2
2018/06/03 DOTA
使用Python的Tornado框架实现一个简单的WebQQ机器人
2015/04/24 Python
Python实现的购物车功能示例
2018/02/11 Python
Python super()方法原理详解
2020/03/31 Python
Pycharm连接远程服务器过程图解
2020/04/30 Python
HTML5+lufylegend实现游戏中的卷轴
2016/02/29 HTML / CSS
Charlotte Tilbury英国官网:英国彩妆品牌
2017/05/26 全球购物
MYPROTEIN澳大利亚官方网站:欧洲运动营养品牌
2019/06/26 全球购物
护士自我鉴定范文
2013/10/06 职场文书
初中生三年学习生活的自我评价
2013/11/03 职场文书
自荐信写法介绍
2014/01/25 职场文书
关于廉洁的广播稿
2014/01/30 职场文书
化工操作工岗位职责
2014/04/29 职场文书
校园文明标语
2014/06/13 职场文书
含预算的公司户外活动方案
2014/08/16 职场文书
写给女朋友的检讨书
2015/05/06 职场文书
优秀乡村医生事迹材料(2016精选版)
2016/02/29 职场文书
标准演讲稿格式结尾应该怎么书写?
2019/07/17 职场文书
《家庭教育》读后感3篇
2019/12/18 职场文书
SpringBoot项目中控制台日志的保存配置操作
2021/06/18 Java/Android
详解CSS3.0(Cascading Style Sheet) 层叠级联样式表
2021/07/16 HTML / CSS