浅析Python requests 模块


Posted in Python onOctober 09, 2020

Python requests 模块

requests 模块是我们使用的 python爬虫 模块 可以完成市场进80%的爬虫需求。

安装

pip install requests

使用

requests模块代码编写的流程:

  • - 指定url
  • - 发起请求
  • - 获取响应对象中的数据
  • - 持久化存储
-------------案例-------------------------
import requests
# 指定url
url="https://www.sogou.com/"
# 发起请求
response = requests.get(url)
# 获取响应对象中的数据
page_text = response.text
# 持久化存储
with open('./sogou.html','w',encoding='utf-8') as fp:
  fp.write()
-------------------------------------------

参数

# post 数据
response = requests.post(url=url,data=data,headers=headers)

# get 数据
response = requests.get(url=url,data=data,headers=headers)

# 返回二进制数据
response.content 

# 返回字符串数据  
response.text  

# 返回json对象   
response.json()

其他了解

1、该模块实现爬取数据前需要查找需要爬取数据的指定URL,可通过浏览器自带抓包功能。

# 浏览器抓取 Ajax 请求
F12 --> Network --> XHR --> Name --> Response

2、上面的headers参数是进行UA伪装为了反反爬

反爬机制:UA检测 --> UA伪装

3、下面是http我们爬包是常用的请求头参数

- accept: 浏览器通过这个头告诉服务器,他所支持的数据类型
- Accept-Charset:浏览器通过这个头告诉服务器,它支持那种字符集

- Accept-Encoding:浏览器通过这个头告诉服务器,支持的压缩格式

- Accept-Language:浏览器通过这个头告诉服务器,他的语言环境

- Host:浏览器同过这个头告诉服务器,想访问哪台主机

- If-ModifiedSince:浏览器通过这个头告诉服务器,缓存数据的时间

- Heferer:浏览器通过这个头告诉服务器,客户及时那个页面来的,防盗链

- Connection:浏览器通过这个头告诉服务器,请求完后是断开链接还是保持链接

- X-Requested-With:XMLHttpRequest 代表通过ajax方式进行访问

- User-Agent:请求载体的身份标识

以上就是浅析Python requests 模块的详细内容,更多关于Python requests 模块的资料请关注三水点靠木其它相关文章!

Python 相关文章推荐
Python输出各行命令详解
Feb 01 Python
Sanic框架流式传输操作示例
Jul 18 Python
python http基本验证方法
Dec 26 Python
pip安装py_zipkin时提示的SSL问题对应
Dec 29 Python
Python获取Redis所有Key以及内容的方法
Feb 19 Python
Python3标准库总结
Feb 19 Python
PyQt5 QTableView设置某一列不可编辑的方法
Jun 25 Python
PyTorch的深度学习入门教程之构建神经网络
Jun 27 Python
从列表或字典创建Pandas的DataFrame对象的方法
Jul 06 Python
PyTorch里面的torch.nn.Parameter()详解
Jan 03 Python
解决Django no such table: django_session的问题
Apr 07 Python
Python headers请求头如何实现快速添加
Nov 03 Python
Python特殊属性property原理及使用方法解析
Oct 09 #Python
python GUI计算器的实现
Oct 09 #Python
Numpy实现卷积神经网络(CNN)的示例
Oct 09 #Python
Python使用socket_TCP实现小文件下载功能
Oct 09 #Python
python实现逻辑回归的示例
Oct 09 #Python
Django生成数据库及添加用户报错解决方案
Oct 09 #Python
pip已经安装好第三方库但pycharm中import时还是标红的解决方案
Oct 09 #Python
You might like
常用星际术语索引(新手指南)
2020/03/04 星际争霸
模仿OSO的论坛(三)
2006/10/09 PHP
Linux下将excel数据导入到mssql数据库中的方法
2010/02/08 PHP
php获取微信共享收货地址的方法
2017/12/21 PHP
js各种验证文本框输入格式(正则表达式)
2010/10/22 Javascript
JavaScript 基础篇(一)
2012/03/30 Javascript
jqplot通过ajax动态画折线图的方法及思路
2013/12/08 Javascript
javascript实现多级联动下拉菜单的方法
2015/02/06 Javascript
JavaScript改变CSS样式的方法汇总
2015/05/07 Javascript
JS实现选项卡实例详解
2015/11/17 Javascript
Highcharts使用简例及异步动态读取数据
2015/12/30 Javascript
详解JavaScript的闭包、IIFE、apply、函数与对象
2016/12/21 Javascript
解决angularjs service中依赖注入$scope报错的问题
2018/10/02 Javascript
详解Vue 动态组件与全局事件绑定总结
2018/11/11 Javascript
如何在JavaScript中优雅的提取循环内数据详解
2019/03/04 Javascript
详解js根据百度地图提供经纬度计算两点距离
2019/05/13 Javascript
关于vue利用postcss-pxtorem进行移动端适配的问题
2019/11/20 Javascript
[46:00]DOTA2上海特级锦标赛主赛事日 - 2 胜者组第一轮#4EG VS Fnatic第一局
2016/03/03 DOTA
详解Python的Flask框架中的signals信号机制
2016/06/13 Python
Python如何实现文本转语音
2016/08/08 Python
Python用zip函数同时遍历多个迭代器示例详解
2016/11/14 Python
Android分包MultiDex策略详解
2017/10/30 Python
Python IDLE入门简介
2017/12/08 Python
python+matplotlib绘制旋转椭圆实例代码
2018/01/12 Python
用Python下载一个网页保存为本地的HTML文件实例
2018/05/21 Python
python实现远程控制电脑
2019/05/23 Python
Python使用线程来接收串口数据的示例
2019/07/02 Python
Python3 hashlib密码散列算法原理详解
2020/03/30 Python
用python对excel查重
2020/12/07 Python
html5中的input新属性range使用记录
2014/09/05 HTML / CSS
英国体育器材进口商店:UK Sport Imports
2017/03/14 全球购物
意大利值得信赖的在线超级药房:PillolaStore
2020/02/05 全球购物
学习自我鉴定
2014/02/01 职场文书
献爱心活动总结
2014/05/07 职场文书
社区党员志愿服务活动方案
2014/08/18 职场文书
2016应届毕业生实习评语
2015/12/01 职场文书