浅析Python requests 模块


Posted in Python onOctober 09, 2020

Python requests 模块

requests 模块是我们使用的 python爬虫 模块 可以完成市场进80%的爬虫需求。

安装

pip install requests

使用

requests模块代码编写的流程:

  • - 指定url
  • - 发起请求
  • - 获取响应对象中的数据
  • - 持久化存储
-------------案例-------------------------
import requests
# 指定url
url="https://www.sogou.com/"
# 发起请求
response = requests.get(url)
# 获取响应对象中的数据
page_text = response.text
# 持久化存储
with open('./sogou.html','w',encoding='utf-8') as fp:
  fp.write()
-------------------------------------------

参数

# post 数据
response = requests.post(url=url,data=data,headers=headers)

# get 数据
response = requests.get(url=url,data=data,headers=headers)

# 返回二进制数据
response.content 

# 返回字符串数据  
response.text  

# 返回json对象   
response.json()

其他了解

1、该模块实现爬取数据前需要查找需要爬取数据的指定URL,可通过浏览器自带抓包功能。

# 浏览器抓取 Ajax 请求
F12 --> Network --> XHR --> Name --> Response

2、上面的headers参数是进行UA伪装为了反反爬

反爬机制:UA检测 --> UA伪装

3、下面是http我们爬包是常用的请求头参数

- accept: 浏览器通过这个头告诉服务器,他所支持的数据类型
- Accept-Charset:浏览器通过这个头告诉服务器,它支持那种字符集

- Accept-Encoding:浏览器通过这个头告诉服务器,支持的压缩格式

- Accept-Language:浏览器通过这个头告诉服务器,他的语言环境

- Host:浏览器同过这个头告诉服务器,想访问哪台主机

- If-ModifiedSince:浏览器通过这个头告诉服务器,缓存数据的时间

- Heferer:浏览器通过这个头告诉服务器,客户及时那个页面来的,防盗链

- Connection:浏览器通过这个头告诉服务器,请求完后是断开链接还是保持链接

- X-Requested-With:XMLHttpRequest 代表通过ajax方式进行访问

- User-Agent:请求载体的身份标识

以上就是浅析Python requests 模块的详细内容,更多关于Python requests 模块的资料请关注三水点靠木其它相关文章!

Python 相关文章推荐
详细解读Python中解析XML数据的方法
Oct 15 Python
Python探索之Metaclass初步了解
Oct 28 Python
Python中应该使用%还是format来格式化字符串
Sep 25 Python
python web自制框架之接受url传递过来的参数实例
Dec 17 Python
Python基础教程之异常详解
Jan 10 Python
Python中的random.uniform()函数教程与实例解析
Mar 02 Python
pow在python中的含义及用法
Jul 11 Python
python实现从wind导入数据
Dec 03 Python
利用python实现逐步回归
Feb 24 Python
Django CSRF认证的几种解决方案
Mar 03 Python
详解Python IO编程
Jul 24 Python
3分钟看懂Python后端必须知道的Django的信号机制
Jul 26 Python
Python特殊属性property原理及使用方法解析
Oct 09 #Python
python GUI计算器的实现
Oct 09 #Python
Numpy实现卷积神经网络(CNN)的示例
Oct 09 #Python
Python使用socket_TCP实现小文件下载功能
Oct 09 #Python
python实现逻辑回归的示例
Oct 09 #Python
Django生成数据库及添加用户报错解决方案
Oct 09 #Python
pip已经安装好第三方库但pycharm中import时还是标红的解决方案
Oct 09 #Python
You might like
PHP 第三节 变量介绍
2012/04/28 PHP
用PHP+MySQL搭建聊天室功能实例代码
2012/08/20 PHP
PHP类中的魔术方法(Magic Method)简明总结
2014/07/08 PHP
jQuery页面刷新(局部、全部)问题分析
2016/01/09 Javascript
JS控制层作圆周运动的方法
2016/06/20 Javascript
js 能实现监听F5页面刷新子iframe 而父页面不刷新的方法
2016/11/09 Javascript
纯原生js实现table表格的增删
2017/01/05 Javascript
Nodejs之http的表单提交
2017/07/07 NodeJs
React-Native 组件之 Modal的使用详解
2017/08/08 Javascript
解决使用bootstrap的dropdown部件时报错:error:Bootstrap dropdown require Popper.js问题
2018/08/30 Javascript
Node.js开发之套接字(socket)编程入门示例
2019/11/05 Javascript
浏览器JavaScript调试功能无法使用解决方案
2020/09/18 Javascript
vue在图片上传的时候压缩图片
2020/11/18 Vue.js
Python设计模式之代理模式实例
2014/04/26 Python
从零学Python之引用和类属性的初步理解
2014/05/15 Python
Python中声明只包含一个元素的元组数据方法
2014/08/25 Python
python脚本设置系统时间的两种方法
2016/02/21 Python
Python生成随机密码的方法
2017/06/16 Python
python实现输入数字的连续加减方法
2018/06/22 Python
彻彻底底地理解Python中的编码问题
2018/10/15 Python
对python修改xml文件的节点值方法详解
2018/12/24 Python
创建Django项目图文实例详解
2019/06/06 Python
pyqt5使用按钮进行界面的跳转方法
2019/06/19 Python
pygame实现俄罗斯方块游戏(AI篇1)
2019/10/29 Python
python基于TCP实现的文件下载器功能案例
2019/12/10 Python
解决Pycharm的项目目录突然消失的问题
2020/01/20 Python
canvas实现俄罗斯方块的方法示例
2018/12/13 HTML / CSS
纠风工作实施方案
2014/03/15 职场文书
春节晚会主持词
2014/03/24 职场文书
集中采购方案
2014/06/10 职场文书
公司的门卫岗位职责
2014/09/09 职场文书
领导班子党的群众路线对照检查材料
2014/09/25 职场文书
导盲犬小Q观后感
2015/06/11 职场文书
Python合并多张图片成PDF
2021/06/09 Python
「偶像大师 MILLION LIVE!」七尾百合子手办开订
2022/03/21 日漫
Windows11 Insider Preview Build 25206今日发布 更新内容汇总
2022/09/23 数码科技