编程 Python

浅析Python requests 模块

Posted in Python onOctober 09, 2020

Python requests 模块

requests 模块是我们使用的 python爬虫模块可以完成市场进80%的爬虫需求。

安装

pip install requests

使用

requests模块代码编写的流程：

- 指定url
- 发起请求
- 获取响应对象中的数据
- 持久化存储

-------------案例-------------------------
import requests
# 指定url
url="https://www.sogou.com/"
# 发起请求
response = requests.get(url)
# 获取响应对象中的数据
page_text = response.text
# 持久化存储
with open('./sogou.html','w',encoding='utf-8') as fp:
  fp.write()
-------------------------------------------

参数

# post 数据
response = requests.post(url=url,data=data,headers=headers)

# get 数据
response = requests.get(url=url,data=data,headers=headers)

# 返回二进制数据
response.content 

# 返回字符串数据  
response.text  

# 返回json对象   
response.json()

其他了解

1、该模块实现爬取数据前需要查找需要爬取数据的指定URL，可通过浏览器自带抓包功能。

# 浏览器抓取 Ajax 请求
F12 --> Network --> XHR --> Name --> Response

2、上面的headers参数是进行UA伪装为了反反爬

反爬机制：UA检测 --> UA伪装

3、下面是http我们爬包是常用的请求头参数

- accept: 浏览器通过这个头告诉服务器，他所支持的数据类型
- Accept-Charset：浏览器通过这个头告诉服务器，它支持那种字符集

- Accept-Encoding：浏览器通过这个头告诉服务器，支持的压缩格式

- Accept-Language：浏览器通过这个头告诉服务器，他的语言环境

- Host：浏览器同过这个头告诉服务器，想访问哪台主机

- If-ModifiedSince：浏览器通过这个头告诉服务器，缓存数据的时间

- Heferer：浏览器通过这个头告诉服务器，客户及时那个页面来的，防盗链

- Connection：浏览器通过这个头告诉服务器，请求完后是断开链接还是保持链接

- X-Requested-With：XMLHttpRequest 代表通过ajax方式进行访问

- User-Agent：请求载体的身份标识

以上就是浅析Python requests 模块的详细内容，更多关于Python requests 模块的资料请关注三水点靠木其它相关文章！

浅析Python requests 模块

- Author -

kevin.Xiang

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

Python线程指南详细介绍

Jan 05 Python

Flask解决跨域的问题示例代码

Feb 12 Python

PHP实现发送和接收JSON请求

Jun 07 Python

python实现将一个数组逆序输出的方法

Jun 25 Python

python中单下划线_的常见用法总结

Jul 10 Python

Python实现将通信达.day文件读取为DataFrame

Dec 22 Python

Python发展史及网络爬虫

Jun 19 Python

Python模块的定义，模块的导入，__name__用法实例分析

Jan 07 Python

如何使用Python破解ZIP或RAR压缩文件密码

Jan 09 Python

基于python实现简单网页服务器代码实例

Sep 14 Python

python 如何上传包到pypi

Dec 24 Python

详解python网络进程

Jun 15 Python

Python特殊属性property原理及使用方法解析

Oct 09 #Python

python GUI计算器的实现

Oct 09 #Python

Numpy实现卷积神经网络(CNN)的示例

Oct 09 #Python

Python使用socket_TCP实现小文件下载功能

Oct 09 #Python

python实现逻辑回归的示例

Oct 09 #Python

Django生成数据库及添加用户报错解决方案

Oct 09 #Python

pip已经安装好第三方库但pycharm中import时还是标红的解决方案

Oct 09 #Python

You might like

php中目录,文件操作详谈

2007/03/19 PHP

php实现的AES加密类定义与用法示例

2018/01/29 PHP

php框架CodeIgniter使用redis的方法分析

2018/04/13 PHP

Javascript-Mozilla和IE中的一个函数直接量的问题分析

2007/08/12 Javascript

javascript 验证日期的函数

2010/03/18 Javascript

JQuery调webservice实现邮箱验证(检测是否可用)

2013/05/21 Javascript

Jquery右下角抖动、浮动实例代码(兼容ie6、FF)

2013/08/15 Javascript

js实现简单的星级选择器提交效果适用于评论等

2013/10/18 Javascript

ExtJS的拖拽效果示例

2013/12/09 Javascript

jfinal与bootstrap的登录跳转实战演习

2015/09/22 Javascript

深入解析JavaScript中的数字对象与字符串对象

2015/10/21 Javascript

JS获取当前使用的浏览器名字以及版本号实现方法

2016/08/19 Javascript

js简单正则验证汉字英文及下划线的方法

2016/11/28 Javascript

js封装tab标签页实例分享

2016/12/19 Javascript

jQuery实现的浮动层div浏览器居中显示效果

2017/02/03 Javascript

Mongoose实现虚拟字段查询的方法详解

2017/08/15 Javascript

webpack中使用iconfont字体图标的方法

2018/02/22 Javascript

解决iview多表头动态更改列元素发生的错误的方法

2018/11/02 Javascript

JS制作简易计算器的实例代码

2020/07/04 Javascript

Python Pandas找到缺失值的位置方法

2018/04/12 Python

基于Django URL传参 FORM表单传数据 get post的用法实例

2018/05/28 Python

Django处理文件上传File Uploads的实例

2018/05/28 Python

在python中利用GDAL对tif文件进行读写的方法

2018/11/29 Python

python-opencv颜色提取分割方法

2018/12/08 Python

Python flask框架post接口调用示例

2019/07/03 Python

Django基础知识 URL路由系统详解

2019/07/18 Python

Python3视频转字符动画的实例代码

2019/08/29 Python

python爬虫工具例举说明

2020/11/30 Python

python中xlutils库用法浅析

2020/12/29 Python

HTML 5 标签、属性、事件及浏览器兼容性速查表附打包下载

2012/10/20 HTML / CSS

Bata印度官网：源自欧洲舒适鞋履品牌

2020/01/30 全球购物

迁户口计划生育证明

2014/10/19 职场文书

2015年挂职锻炼工作总结

2014/12/12 职场文书

委托公证书样本

2015/01/23 职场文书

2015年幼儿园教研活动总结

2015/03/25 职场文书

vue使用element-ui按需引入

2022/05/20 Vue.js