浅析Python requests 模块


Posted in Python onOctober 09, 2020

Python requests 模块

requests 模块是我们使用的 python爬虫 模块 可以完成市场进80%的爬虫需求。

安装

pip install requests

使用

requests模块代码编写的流程:

  • - 指定url
  • - 发起请求
  • - 获取响应对象中的数据
  • - 持久化存储
-------------案例-------------------------
import requests
# 指定url
url="https://www.sogou.com/"
# 发起请求
response = requests.get(url)
# 获取响应对象中的数据
page_text = response.text
# 持久化存储
with open('./sogou.html','w',encoding='utf-8') as fp:
  fp.write()
-------------------------------------------

参数

# post 数据
response = requests.post(url=url,data=data,headers=headers)

# get 数据
response = requests.get(url=url,data=data,headers=headers)

# 返回二进制数据
response.content 

# 返回字符串数据  
response.text  

# 返回json对象   
response.json()

其他了解

1、该模块实现爬取数据前需要查找需要爬取数据的指定URL,可通过浏览器自带抓包功能。

# 浏览器抓取 Ajax 请求
F12 --> Network --> XHR --> Name --> Response

2、上面的headers参数是进行UA伪装为了反反爬

反爬机制:UA检测 --> UA伪装

3、下面是http我们爬包是常用的请求头参数

- accept: 浏览器通过这个头告诉服务器,他所支持的数据类型
- Accept-Charset:浏览器通过这个头告诉服务器,它支持那种字符集

- Accept-Encoding:浏览器通过这个头告诉服务器,支持的压缩格式

- Accept-Language:浏览器通过这个头告诉服务器,他的语言环境

- Host:浏览器同过这个头告诉服务器,想访问哪台主机

- If-ModifiedSince:浏览器通过这个头告诉服务器,缓存数据的时间

- Heferer:浏览器通过这个头告诉服务器,客户及时那个页面来的,防盗链

- Connection:浏览器通过这个头告诉服务器,请求完后是断开链接还是保持链接

- X-Requested-With:XMLHttpRequest 代表通过ajax方式进行访问

- User-Agent:请求载体的身份标识

以上就是浅析Python requests 模块的详细内容,更多关于Python requests 模块的资料请关注三水点靠木其它相关文章!

Python 相关文章推荐
Python Web框架Pylons中使用MongoDB的例子
Dec 03 Python
python开发中range()函数用法实例分析
Nov 12 Python
使用Python编写基于DHT协议的BT资源爬虫
Mar 19 Python
Python单链表简单实现代码
Apr 27 Python
使用Python从零开始撸一个区块链
Mar 14 Python
python将视频转换为全字符视频
Apr 26 Python
通过pycharm使用git的步骤(图文详解)
Jun 13 Python
Pycharm+Python+PyQt5使用详解
Sep 25 Python
详解django中Template语言
Feb 22 Python
探秘TensorFlow 和 NumPy 的 Broadcasting 机制
Mar 13 Python
详解用Pytest+Allure生成漂亮的HTML图形化测试报告
Mar 31 Python
python中子类与父类的关系基础知识点
Feb 02 Python
Python特殊属性property原理及使用方法解析
Oct 09 #Python
python GUI计算器的实现
Oct 09 #Python
Numpy实现卷积神经网络(CNN)的示例
Oct 09 #Python
Python使用socket_TCP实现小文件下载功能
Oct 09 #Python
python实现逻辑回归的示例
Oct 09 #Python
Django生成数据库及添加用户报错解决方案
Oct 09 #Python
pip已经安装好第三方库但pycharm中import时还是标红的解决方案
Oct 09 #Python
You might like
ecshop 订单确认中显示省市地址信息的方法
2010/03/15 PHP
PHP执行linux系统命令的常用函数使用说明
2010/04/27 PHP
CodeIgniter错误mysql_connect(): No such file or directory解决方法
2014/09/06 PHP
使用GDB调试PHP代码,解决PHP代码死循环问题
2015/03/02 PHP
PHP 芝麻信用接入的注意事项
2016/12/01 PHP
JQuery Dialog(JS 模态窗口,可拖拽的DIV)
2010/02/07 Javascript
jQuery cdn使用介绍
2013/05/08 Javascript
浅谈JavaScript函数参数的可修改性问题
2013/12/05 Javascript
javascript计算星座属相(十二生肖属相)示例代码
2014/01/09 Javascript
node.js中的http.request.end方法使用说明
2014/12/10 Javascript
jQuery实现响应鼠标事件的图片透明效果【附demo源码下载】
2016/06/16 Javascript
JS经典正则表达式笔试题汇总
2016/12/15 Javascript
vue之浏览器存储方法封装实例
2018/03/15 Javascript
利用React Router4实现的服务端直出渲染(SSR)
2019/01/07 Javascript
jQuery实现的导航条点击后高亮显示功能示例
2019/03/04 jQuery
微信小程序获取用户绑定手机号方法示例
2019/07/21 Javascript
[01:02:06]LGD vs Mineski Supermajor 胜者组 BO3 第二场 6.5
2018/06/06 DOTA
详解Python设计模式编程中观察者模式与策略模式的运用
2016/03/02 Python
django定期执行任务(实例讲解)
2017/11/03 Python
Django使用Mysql数据库已经存在的数据表方法
2018/05/27 Python
python实现飞机大战
2018/09/11 Python
深入浅析Python2.x和3.x版本的主要区别
2018/11/30 Python
Python Pandas 获取列匹配特定值的行的索引问题
2019/07/01 Python
详解Python文件修改的两种方式
2019/08/22 Python
python GUI库图形界面开发之PyQt5切换按钮控件QPushButton详细使用方法与实例
2020/02/28 Python
Python图像识别+KNN求解数独的实现
2020/11/13 Python
解决python3.x安装numpy成功但import出错的问题
2020/11/17 Python
大学生求职简历的自我评价范文
2013/10/12 职场文书
会计电算化应届生求职信
2013/11/03 职场文书
消防安全宣传标语
2014/06/07 职场文书
一份关于丢失公司财物的检讨书
2014/09/19 职场文书
关于运动会的广播稿
2014/09/22 职场文书
2019年公司卫生管理制度样本
2019/08/21 职场文书
PHP 技巧 * SVG 保存为图片(分享图生成)
2021/04/02 PHP
python中%格式表达式实例用法
2021/06/18 Python
pandas中pd.groupby()的用法详解
2022/06/16 Python