浅析Python requests 模块


Posted in Python onOctober 09, 2020

Python requests 模块

requests 模块是我们使用的 python爬虫 模块 可以完成市场进80%的爬虫需求。

安装

pip install requests

使用

requests模块代码编写的流程:

  • - 指定url
  • - 发起请求
  • - 获取响应对象中的数据
  • - 持久化存储
-------------案例-------------------------
import requests
# 指定url
url="https://www.sogou.com/"
# 发起请求
response = requests.get(url)
# 获取响应对象中的数据
page_text = response.text
# 持久化存储
with open('./sogou.html','w',encoding='utf-8') as fp:
  fp.write()
-------------------------------------------

参数

# post 数据
response = requests.post(url=url,data=data,headers=headers)

# get 数据
response = requests.get(url=url,data=data,headers=headers)

# 返回二进制数据
response.content 

# 返回字符串数据  
response.text  

# 返回json对象   
response.json()

其他了解

1、该模块实现爬取数据前需要查找需要爬取数据的指定URL,可通过浏览器自带抓包功能。

# 浏览器抓取 Ajax 请求
F12 --> Network --> XHR --> Name --> Response

2、上面的headers参数是进行UA伪装为了反反爬

反爬机制:UA检测 --> UA伪装

3、下面是http我们爬包是常用的请求头参数

- accept: 浏览器通过这个头告诉服务器,他所支持的数据类型
- Accept-Charset:浏览器通过这个头告诉服务器,它支持那种字符集

- Accept-Encoding:浏览器通过这个头告诉服务器,支持的压缩格式

- Accept-Language:浏览器通过这个头告诉服务器,他的语言环境

- Host:浏览器同过这个头告诉服务器,想访问哪台主机

- If-ModifiedSince:浏览器通过这个头告诉服务器,缓存数据的时间

- Heferer:浏览器通过这个头告诉服务器,客户及时那个页面来的,防盗链

- Connection:浏览器通过这个头告诉服务器,请求完后是断开链接还是保持链接

- X-Requested-With:XMLHttpRequest 代表通过ajax方式进行访问

- User-Agent:请求载体的身份标识

以上就是浅析Python requests 模块的详细内容,更多关于Python requests 模块的资料请关注三水点靠木其它相关文章!

Python 相关文章推荐
Python线程指南详细介绍
Jan 05 Python
Flask解决跨域的问题示例代码
Feb 12 Python
PHP实现发送和接收JSON请求
Jun 07 Python
python实现将一个数组逆序输出的方法
Jun 25 Python
python中单下划线_的常见用法总结
Jul 10 Python
Python实现将通信达.day文件读取为DataFrame
Dec 22 Python
Python发展史及网络爬虫
Jun 19 Python
Python模块的定义,模块的导入,__name__用法实例分析
Jan 07 Python
如何使用Python破解ZIP或RAR压缩文件密码
Jan 09 Python
基于python实现简单网页服务器代码实例
Sep 14 Python
python 如何上传包到pypi
Dec 24 Python
详解python网络进程
Jun 15 Python
Python特殊属性property原理及使用方法解析
Oct 09 #Python
python GUI计算器的实现
Oct 09 #Python
Numpy实现卷积神经网络(CNN)的示例
Oct 09 #Python
Python使用socket_TCP实现小文件下载功能
Oct 09 #Python
python实现逻辑回归的示例
Oct 09 #Python
Django生成数据库及添加用户报错解决方案
Oct 09 #Python
pip已经安装好第三方库但pycharm中import时还是标红的解决方案
Oct 09 #Python
You might like
php中目录,文件操作详谈
2007/03/19 PHP
php实现的AES加密类定义与用法示例
2018/01/29 PHP
php框架CodeIgniter使用redis的方法分析
2018/04/13 PHP
Javascript-Mozilla和IE中的一个函数直接量的问题分析
2007/08/12 Javascript
javascript 验证日期的函数
2010/03/18 Javascript
JQuery调webservice实现邮箱验证(检测是否可用)
2013/05/21 Javascript
Jquery右下角抖动、浮动 实例代码(兼容ie6、FF)
2013/08/15 Javascript
js实现简单的星级选择器提交效果适用于评论等
2013/10/18 Javascript
ExtJS的拖拽效果示例
2013/12/09 Javascript
jfinal与bootstrap的登录跳转实战演习
2015/09/22 Javascript
深入解析JavaScript中的数字对象与字符串对象
2015/10/21 Javascript
JS获取当前使用的浏览器名字以及版本号实现方法
2016/08/19 Javascript
js简单正则验证汉字英文及下划线的方法
2016/11/28 Javascript
js封装tab标签页实例分享
2016/12/19 Javascript
jQuery实现的浮动层div浏览器居中显示效果
2017/02/03 Javascript
Mongoose实现虚拟字段查询的方法详解
2017/08/15 Javascript
webpack中使用iconfont字体图标的方法
2018/02/22 Javascript
解决iview多表头动态更改列元素发生的错误的方法
2018/11/02 Javascript
JS制作简易计算器的实例代码
2020/07/04 Javascript
Python Pandas找到缺失值的位置方法
2018/04/12 Python
基于Django URL传参 FORM表单传数据 get post的用法实例
2018/05/28 Python
Django处理文件上传File Uploads的实例
2018/05/28 Python
在python中利用GDAL对tif文件进行读写的方法
2018/11/29 Python
python-opencv颜色提取分割方法
2018/12/08 Python
Python flask框架post接口调用示例
2019/07/03 Python
Django基础知识 URL路由系统详解
2019/07/18 Python
Python3视频转字符动画的实例代码
2019/08/29 Python
python爬虫工具例举说明
2020/11/30 Python
python中xlutils库用法浅析
2020/12/29 Python
HTML 5 标签、属性、事件及浏览器兼容性速查表 附打包下载
2012/10/20 HTML / CSS
Bata印度官网:源自欧洲舒适鞋履品牌
2020/01/30 全球购物
迁户口计划生育证明
2014/10/19 职场文书
2015年挂职锻炼工作总结
2014/12/12 职场文书
委托公证书样本
2015/01/23 职场文书
2015年幼儿园教研活动总结
2015/03/25 职场文书
vue使用element-ui按需引入
2022/05/20 Vue.js