浅析Python requests 模块


Posted in Python onOctober 09, 2020

Python requests 模块

requests 模块是我们使用的 python爬虫 模块 可以完成市场进80%的爬虫需求。

安装

pip install requests

使用

requests模块代码编写的流程:

  • - 指定url
  • - 发起请求
  • - 获取响应对象中的数据
  • - 持久化存储
-------------案例-------------------------
import requests
# 指定url
url="https://www.sogou.com/"
# 发起请求
response = requests.get(url)
# 获取响应对象中的数据
page_text = response.text
# 持久化存储
with open('./sogou.html','w',encoding='utf-8') as fp:
  fp.write()
-------------------------------------------

参数

# post 数据
response = requests.post(url=url,data=data,headers=headers)

# get 数据
response = requests.get(url=url,data=data,headers=headers)

# 返回二进制数据
response.content 

# 返回字符串数据  
response.text  

# 返回json对象   
response.json()

其他了解

1、该模块实现爬取数据前需要查找需要爬取数据的指定URL,可通过浏览器自带抓包功能。

# 浏览器抓取 Ajax 请求
F12 --> Network --> XHR --> Name --> Response

2、上面的headers参数是进行UA伪装为了反反爬

反爬机制:UA检测 --> UA伪装

3、下面是http我们爬包是常用的请求头参数

- accept: 浏览器通过这个头告诉服务器,他所支持的数据类型
- Accept-Charset:浏览器通过这个头告诉服务器,它支持那种字符集

- Accept-Encoding:浏览器通过这个头告诉服务器,支持的压缩格式

- Accept-Language:浏览器通过这个头告诉服务器,他的语言环境

- Host:浏览器同过这个头告诉服务器,想访问哪台主机

- If-ModifiedSince:浏览器通过这个头告诉服务器,缓存数据的时间

- Heferer:浏览器通过这个头告诉服务器,客户及时那个页面来的,防盗链

- Connection:浏览器通过这个头告诉服务器,请求完后是断开链接还是保持链接

- X-Requested-With:XMLHttpRequest 代表通过ajax方式进行访问

- User-Agent:请求载体的身份标识

以上就是浅析Python requests 模块的详细内容,更多关于Python requests 模块的资料请关注三水点靠木其它相关文章!

Python 相关文章推荐
Python的Django框架安装全攻略
Jul 15 Python
全面了解Python的getattr(),setattr(),delattr(),hasattr()
Jun 14 Python
浅谈Python中range和xrange的区别
Dec 20 Python
Pycharm 创建 Django admin 用户名和密码的实例
May 30 Python
python使用Matplotlib画饼图
Sep 25 Python
python实现点击按钮修改数据的方法
Jul 17 Python
python3.7 sys模块的具体使用
Jul 22 Python
python验证码图片处理(二值化)
Nov 01 Python
Python读取多列数据以及用matplotlib制作图表方法实例
Sep 23 Python
python实现企业微信定时发送文本消息的示例代码
Nov 24 Python
python爬虫泛滥的解决方法详解
Nov 25 Python
python基于爬虫+django,打造个性化API接口
Jan 21 Python
Python特殊属性property原理及使用方法解析
Oct 09 #Python
python GUI计算器的实现
Oct 09 #Python
Numpy实现卷积神经网络(CNN)的示例
Oct 09 #Python
Python使用socket_TCP实现小文件下载功能
Oct 09 #Python
python实现逻辑回归的示例
Oct 09 #Python
Django生成数据库及添加用户报错解决方案
Oct 09 #Python
pip已经安装好第三方库但pycharm中import时还是标红的解决方案
Oct 09 #Python
You might like
PHP下利用shell后台运行PHP脚本,并获取该脚本的Process ID的代码
2011/09/19 PHP
PHP获取网址的顶级域名函数代码
2012/09/24 PHP
php时间计算相关问题小结
2016/05/09 PHP
php的扩展写法总结
2019/05/14 PHP
php如何把表单内容提交到数据库
2019/07/08 PHP
laravel 解决Eloquent ORM的save方法无法插入数据的问题
2019/10/21 PHP
PHPStorm2020.1永久激活及下载更新至2020(推荐)
2020/09/25 PHP
JQUERY设置IFRAME的SRC值的代码
2010/11/30 Javascript
为JS扩展Array.prototype.indexOf引发的问题探讨及解决
2013/04/24 Javascript
公共js在页面底部加载的注意事项介绍
2013/07/18 Javascript
你有必要知道的25个JavaScript面试题
2015/12/29 Javascript
脚手架vue-cli工程webpack的基本用法详解
2018/09/29 Javascript
Vue组件间通信 Vuex的用法解析
2019/08/05 Javascript
微信小程序实现canvas分享朋友圈海报
2020/06/21 Javascript
[51:36]Optic vs Newbee 2018国际邀请赛小组赛BO2 第一场 8.17
2018/08/18 DOTA
django模型中的字段和model名显示为中文小技巧分享
2014/11/18 Python
Python 实现「食行生鲜」签到领积分功能
2018/09/26 Python
python 为什么说eval要慎用
2019/03/26 Python
Python 寻找局部最高点的实现
2019/12/05 Python
使用pyinstaller逆向.pyc文件
2019/12/20 Python
python实现在线翻译
2020/06/18 Python
在Tensorflow中实现leakyRelu操作详解(高效)
2020/06/30 Python
python实现扫雷游戏的示例
2020/10/20 Python
Champion官网:美国冠军运动服装
2017/01/25 全球购物
纪伊国屋新加坡网上书店:Kinokuniya新加坡
2017/12/29 全球购物
DOUGLAS荷兰:购买香水和化妆品
2020/10/24 全球购物
我的求职计划书
2014/01/10 职场文书
高中运动会广播稿
2014/01/21 职场文书
新闻学专业大学生职业生涯规划范文
2014/03/02 职场文书
餐饮商业计划书范文
2014/04/29 职场文书
财务稽核岗位职责
2015/04/13 职场文书
房产电话营销开场白
2015/05/29 职场文书
信用卡工资证明范本
2015/06/19 职场文书
PyCharm 安装与使用配置教程(windows,mac通用)
2021/05/12 Python
Ajax请求超时与网络异常处理图文详解
2021/05/23 Javascript
CSS3实现列表无限滚动/轮播效果
2021/06/23 HTML / CSS