浅析Python requests 模块


Posted in Python onOctober 09, 2020

Python requests 模块

requests 模块是我们使用的 python爬虫 模块 可以完成市场进80%的爬虫需求。

安装

pip install requests

使用

requests模块代码编写的流程:

  • - 指定url
  • - 发起请求
  • - 获取响应对象中的数据
  • - 持久化存储
-------------案例-------------------------
import requests
# 指定url
url="https://www.sogou.com/"
# 发起请求
response = requests.get(url)
# 获取响应对象中的数据
page_text = response.text
# 持久化存储
with open('./sogou.html','w',encoding='utf-8') as fp:
  fp.write()
-------------------------------------------

参数

# post 数据
response = requests.post(url=url,data=data,headers=headers)

# get 数据
response = requests.get(url=url,data=data,headers=headers)

# 返回二进制数据
response.content 

# 返回字符串数据  
response.text  

# 返回json对象   
response.json()

其他了解

1、该模块实现爬取数据前需要查找需要爬取数据的指定URL,可通过浏览器自带抓包功能。

# 浏览器抓取 Ajax 请求
F12 --> Network --> XHR --> Name --> Response

2、上面的headers参数是进行UA伪装为了反反爬

反爬机制:UA检测 --> UA伪装

3、下面是http我们爬包是常用的请求头参数

- accept: 浏览器通过这个头告诉服务器,他所支持的数据类型
- Accept-Charset:浏览器通过这个头告诉服务器,它支持那种字符集

- Accept-Encoding:浏览器通过这个头告诉服务器,支持的压缩格式

- Accept-Language:浏览器通过这个头告诉服务器,他的语言环境

- Host:浏览器同过这个头告诉服务器,想访问哪台主机

- If-ModifiedSince:浏览器通过这个头告诉服务器,缓存数据的时间

- Heferer:浏览器通过这个头告诉服务器,客户及时那个页面来的,防盗链

- Connection:浏览器通过这个头告诉服务器,请求完后是断开链接还是保持链接

- X-Requested-With:XMLHttpRequest 代表通过ajax方式进行访问

- User-Agent:请求载体的身份标识

以上就是浅析Python requests 模块的详细内容,更多关于Python requests 模块的资料请关注三水点靠木其它相关文章!

Python 相关文章推荐
使用python调用浏览器并打开一个网址的例子
Jun 05 Python
Python pickle模块用法实例
Apr 14 Python
简单的python后台管理程序
Apr 13 Python
python numpy数组的索引和切片的操作方法
Oct 20 Python
python代理工具mitmproxy使用指南
Jul 04 Python
python小程序实现刷票功能详解
Jul 17 Python
python的mysql数据库建立表与插入数据操作示例
Sep 30 Python
Pyqt5 关于流式布局和滚动条的综合使用示例代码
Mar 24 Python
详解基于Jupyter notebooks采用sklearn库实现多元回归方程编程
Mar 25 Python
Python使用多进程运行含有任意个参数的函数
May 02 Python
python绘制箱型图
Apr 27 Python
Python机器学习三大件之一numpy
May 10 Python
Python特殊属性property原理及使用方法解析
Oct 09 #Python
python GUI计算器的实现
Oct 09 #Python
Numpy实现卷积神经网络(CNN)的示例
Oct 09 #Python
Python使用socket_TCP实现小文件下载功能
Oct 09 #Python
python实现逻辑回归的示例
Oct 09 #Python
Django生成数据库及添加用户报错解决方案
Oct 09 #Python
pip已经安装好第三方库但pycharm中import时还是标红的解决方案
Oct 09 #Python
You might like
php代码中使用换行及(\n或\r\n和br)的应用
2013/02/02 PHP
利用PHP访问带有密码的Redis方法示例
2017/02/09 PHP
关于Yii2框架跑脚本时内存泄漏问题的分析与解决
2019/12/01 PHP
根据分辨率不同,调用不同的css文件
2006/07/07 Javascript
JavaScript入门之事件、cookie、定时等
2011/10/21 Javascript
非常有用的40款jQuery 插件推荐(系列二)
2011/12/25 Javascript
js/jquery去掉空格,回车,换行示例代码
2013/11/05 Javascript
js实现网页右上角滑出会自动消失大幅广告的方法
2015/02/27 Javascript
JS显示表格内指定行html代码的方法
2015/03/31 Javascript
不依赖Flash和任何JS库实现文本复制与剪切附源码下载
2015/10/09 Javascript
javascript类型系统——undefined和null全面了解
2016/07/13 Javascript
jQuery模拟实现的select点击选择效果【附demo源码下载】
2016/11/09 Javascript
win系统下nodejs环境安装配置
2017/05/04 NodeJs
vue2.0安装style/css loader的方法
2018/03/14 Javascript
微信小程序实现简易table表格
2020/06/19 Javascript
Vue实现搜索结果高亮显示关键字
2019/05/28 Javascript
js 下拉菜单点击旁边收起实现(踩坑记)
2019/09/29 Javascript
vue自定义switch开关组件,实现样式可自行更改
2019/11/01 Javascript
JS常见错误(Error)及处理方案详解
2020/07/02 Javascript
js实现淘宝浏览商品放大镜功能
2020/10/28 Javascript
Python实现的数据结构与算法之基本搜索详解
2015/04/22 Python
python中引用与复制用法实例分析
2015/06/04 Python
Python打印斐波拉契数列实例
2015/07/07 Python
python 多线程实现检测服务器在线情况
2015/11/25 Python
Pandas 数据框增、删、改、查、去重、抽样基本操作方法
2018/04/12 Python
Pytorch通过保存为ONNX模型转TensorRT5的实现
2020/05/25 Python
python操作微信自动发消息的实现(微信聊天机器人)
2020/07/14 Python
皮姆斯勒语言学习:Pimsleur Language Programs
2018/06/30 全球购物
荷兰家电销售网站:Welhof
2020/12/08 全球购物
类的核心特性有哪些
2014/01/01 面试题
盛大二次面试题
2016/11/18 面试题
PHP使用Redis队列执行定时任务实例讲解
2021/03/24 PHP
赡养老人协议书
2014/04/21 职场文书
2015年话务员工作总结
2015/04/29 职场文书
本科毕业论文答辩稿
2015/06/23 职场文书
javascript的setTimeout()使用方法总结
2021/11/20 Javascript