浅析Python requests 模块


Posted in Python onOctober 09, 2020

Python requests 模块

requests 模块是我们使用的 python爬虫 模块 可以完成市场进80%的爬虫需求。

安装

pip install requests

使用

requests模块代码编写的流程:

  • - 指定url
  • - 发起请求
  • - 获取响应对象中的数据
  • - 持久化存储
-------------案例-------------------------
import requests
# 指定url
url="https://www.sogou.com/"
# 发起请求
response = requests.get(url)
# 获取响应对象中的数据
page_text = response.text
# 持久化存储
with open('./sogou.html','w',encoding='utf-8') as fp:
  fp.write()
-------------------------------------------

参数

# post 数据
response = requests.post(url=url,data=data,headers=headers)

# get 数据
response = requests.get(url=url,data=data,headers=headers)

# 返回二进制数据
response.content 

# 返回字符串数据  
response.text  

# 返回json对象   
response.json()

其他了解

1、该模块实现爬取数据前需要查找需要爬取数据的指定URL,可通过浏览器自带抓包功能。

# 浏览器抓取 Ajax 请求
F12 --> Network --> XHR --> Name --> Response

2、上面的headers参数是进行UA伪装为了反反爬

反爬机制:UA检测 --> UA伪装

3、下面是http我们爬包是常用的请求头参数

- accept: 浏览器通过这个头告诉服务器,他所支持的数据类型
- Accept-Charset:浏览器通过这个头告诉服务器,它支持那种字符集

- Accept-Encoding:浏览器通过这个头告诉服务器,支持的压缩格式

- Accept-Language:浏览器通过这个头告诉服务器,他的语言环境

- Host:浏览器同过这个头告诉服务器,想访问哪台主机

- If-ModifiedSince:浏览器通过这个头告诉服务器,缓存数据的时间

- Heferer:浏览器通过这个头告诉服务器,客户及时那个页面来的,防盗链

- Connection:浏览器通过这个头告诉服务器,请求完后是断开链接还是保持链接

- X-Requested-With:XMLHttpRequest 代表通过ajax方式进行访问

- User-Agent:请求载体的身份标识

以上就是浅析Python requests 模块的详细内容,更多关于Python requests 模块的资料请关注三水点靠木其它相关文章!

Python 相关文章推荐
Python GAE、Django导出Excel的方法
Nov 24 Python
用python删除java文件头上版权信息的方法
Jul 31 Python
用实例分析Python中method的参数传递过程
Apr 02 Python
Python脚本处理空格的方法
Aug 08 Python
Python实现批量检测HTTP服务的状态
Oct 27 Python
Python中模块与包有相同名字的处理方法
May 05 Python
Python实现接受任意个数参数的函数方法
Apr 21 Python
Python JSON格式数据的提取和保存的实现
Mar 22 Python
Python matplotlib绘制饼状图功能示例
Sep 10 Python
使用python实现回文数的四种方法小结
Nov 24 Python
pymysql 插入数据 转义处理方式
Mar 02 Python
用python计算文件的MD5值
Dec 23 Python
Python特殊属性property原理及使用方法解析
Oct 09 #Python
python GUI计算器的实现
Oct 09 #Python
Numpy实现卷积神经网络(CNN)的示例
Oct 09 #Python
Python使用socket_TCP实现小文件下载功能
Oct 09 #Python
python实现逻辑回归的示例
Oct 09 #Python
Django生成数据库及添加用户报错解决方案
Oct 09 #Python
pip已经安装好第三方库但pycharm中import时还是标红的解决方案
Oct 09 #Python
You might like
PHP 出现乱码和Sessions验证问题的解决方法!
2008/12/06 PHP
PHP使用数组实现队列
2012/02/05 PHP
关于Sphinx创建全文检索的索引介绍
2013/06/25 PHP
php加密解密函数authcode的用法详细解析
2013/10/28 PHP
PHP实现字符串翻转功能的方法【递归与循环算法】
2017/11/03 PHP
PHP赋值的内部是如何跑的详解
2019/01/13 PHP
js对列表中第一个值处理与jsp页面对列表中第一个值处理的区别详解
2013/11/05 Javascript
js和jquery中循环的退出和继续学习记录
2014/09/06 Javascript
javascript模拟map输出与去除重复项的方法
2015/02/09 Javascript
JavaScript 浏览器对象模型BOM使用介绍
2015/04/13 Javascript
jquery属性,遍历,HTML操作方法详解
2016/09/17 Javascript
JavaScript 输出显示内容(document.write、alert、innerHTML、console.log)
2016/12/14 Javascript
Angular的自定义指令以及实例
2016/12/26 Javascript
微信小程序 picker-view 组件详解及简单实例
2017/01/10 Javascript
javascript数组去重常用方法实例分析
2017/04/11 Javascript
深入理解JavaScript 参数按值传递
2017/05/24 Javascript
vue router路由嵌套不显示问题的解决方法
2017/06/17 Javascript
使用JavaScript开发跨平台的桌面应用详解
2017/07/27 Javascript
angular中ui calendar的一些使用心得(推荐)
2017/11/03 Javascript
vue 使用ref 让父组件调用子组件的方法
2018/02/08 Javascript
封装微信小程序http拦截器过程解析
2019/08/13 Javascript
浅谈对于“不用setInterval,用setTimeout”的理解
2019/08/28 Javascript
Vue通过WebSocket建立长连接的实现代码
2019/11/05 Javascript
[00:20]TI9观赛名额抽取Ⅱ
2019/07/24 DOTA
编写Python的web框架中的Model的教程
2015/04/29 Python
Python使用修饰器执行函数的参数检查功能示例
2017/09/26 Python
Python基于贪心算法解决背包问题示例
2017/11/27 Python
Python判断以什么结尾以什么开头的实例
2018/10/27 Python
Python 安装 virturalenv 虚拟环境的教程详解
2020/02/21 Python
Python虚拟环境的创建和包下载过程分析
2020/06/19 Python
瑜伽国际:Yoga International
2018/04/18 全球购物
公司爱心捐款倡议书
2014/05/14 职场文书
技术比武方案
2014/05/19 职场文书
MongoDB数据库常用的10条操作命令
2021/06/18 MongoDB
动画「半妖的夜叉姬」新BD特典图公开
2022/03/22 日漫
Python读取和写入Excel数据
2022/04/20 Python