浅析Python requests 模块


Posted in Python onOctober 09, 2020

Python requests 模块

requests 模块是我们使用的 python爬虫 模块 可以完成市场进80%的爬虫需求。

安装

pip install requests

使用

requests模块代码编写的流程:

  • - 指定url
  • - 发起请求
  • - 获取响应对象中的数据
  • - 持久化存储
-------------案例-------------------------
import requests
# 指定url
url="https://www.sogou.com/"
# 发起请求
response = requests.get(url)
# 获取响应对象中的数据
page_text = response.text
# 持久化存储
with open('./sogou.html','w',encoding='utf-8') as fp:
  fp.write()
-------------------------------------------

参数

# post 数据
response = requests.post(url=url,data=data,headers=headers)

# get 数据
response = requests.get(url=url,data=data,headers=headers)

# 返回二进制数据
response.content 

# 返回字符串数据  
response.text  

# 返回json对象   
response.json()

其他了解

1、该模块实现爬取数据前需要查找需要爬取数据的指定URL,可通过浏览器自带抓包功能。

# 浏览器抓取 Ajax 请求
F12 --> Network --> XHR --> Name --> Response

2、上面的headers参数是进行UA伪装为了反反爬

反爬机制:UA检测 --> UA伪装

3、下面是http我们爬包是常用的请求头参数

- accept: 浏览器通过这个头告诉服务器,他所支持的数据类型
- Accept-Charset:浏览器通过这个头告诉服务器,它支持那种字符集

- Accept-Encoding:浏览器通过这个头告诉服务器,支持的压缩格式

- Accept-Language:浏览器通过这个头告诉服务器,他的语言环境

- Host:浏览器同过这个头告诉服务器,想访问哪台主机

- If-ModifiedSince:浏览器通过这个头告诉服务器,缓存数据的时间

- Heferer:浏览器通过这个头告诉服务器,客户及时那个页面来的,防盗链

- Connection:浏览器通过这个头告诉服务器,请求完后是断开链接还是保持链接

- X-Requested-With:XMLHttpRequest 代表通过ajax方式进行访问

- User-Agent:请求载体的身份标识

以上就是浅析Python requests 模块的详细内容,更多关于Python requests 模块的资料请关注三水点靠木其它相关文章!

Python 相关文章推荐
Python 第一步 hello world
Sep 25 Python
python3.3教程之模拟百度登陆代码分享
Jan 16 Python
python进阶教程之词典、字典、dict
Aug 29 Python
python通过elixir包操作mysql数据库实例代码
Jan 31 Python
python 遍历列表提取下标和值的实例
Dec 25 Python
pandas的排序和排名的具体使用
Jul 31 Python
Python爬虫:将headers请求头字符串转为字典的方法
Aug 21 Python
Python中断多重循环的思路总结
Oct 04 Python
对Tensorflow中Device实例的生成和管理详解
Feb 04 Python
python GUI库图形界面开发之PyQt5工具栏控件QToolBar的详细使用方法与实例
Feb 28 Python
Python 抓取数据存储到Redis中的操作
Jul 16 Python
详解python算法常用技巧与内置库
Oct 17 Python
Python特殊属性property原理及使用方法解析
Oct 09 #Python
python GUI计算器的实现
Oct 09 #Python
Numpy实现卷积神经网络(CNN)的示例
Oct 09 #Python
Python使用socket_TCP实现小文件下载功能
Oct 09 #Python
python实现逻辑回归的示例
Oct 09 #Python
Django生成数据库及添加用户报错解决方案
Oct 09 #Python
pip已经安装好第三方库但pycharm中import时还是标红的解决方案
Oct 09 #Python
You might like
用PHP动态创建Flash动画
2006/10/09 PHP
PHP输出XML到页面的3种方法详解
2013/06/06 PHP
50个优秀经典PHP算法大集合 附源码
2020/08/26 PHP
javascript各种复制代码收集
2008/09/20 Javascript
javascript 传统事件模型构造的事件监听器实现代码
2010/05/31 Javascript
jquery弹出框的用法示例(一)
2013/08/26 Javascript
ExtJS4中使用mixins实现多继承示例
2013/12/03 Javascript
javascript实现在指定元素中垂直水平居中
2015/09/13 Javascript
jQuery ajax时间差导致的变量赋值问题分析
2016/01/22 Javascript
jQuery中设置form表单中action值的实现方法
2016/05/25 Javascript
js利用正则表达式检验输入内容是否为网址
2016/07/05 Javascript
NodeJS处理Express中异步错误
2017/03/26 NodeJs
教你快速搭建Node.Js服务器的方法教程
2017/03/30 Javascript
angular4 如何在全局设置路由跳转动画的方法
2017/08/30 Javascript
在Mac下彻底卸载node和npm的方法
2018/05/16 Javascript
clipboard在vue中的使用的方法示例
2018/10/19 Javascript
仿iPhone通讯录制作小程序自定义选择组件的实现
2019/05/23 Javascript
python操作xml文件详细介绍
2014/06/09 Python
在Python中使用判断语句和循环的教程
2015/04/25 Python
Python中用于转换字母为小写的lower()方法使用简介
2015/05/19 Python
Python中time模块和datetime模块的用法示例
2016/02/28 Python
Python入门_浅谈数据结构的4种基本类型
2017/05/16 Python
详谈套接字中SO_REUSEPORT和SO_REUSEADDR的区别
2018/04/28 Python
在Python中COM口的调用方法
2019/07/03 Python
opencv python如何实现图像二值化
2020/02/03 Python
Betsey Johnson官网:妖娆可爱的连衣裙及鞋子、手袋和配件
2016/12/30 全球购物
GUESS西班牙官方网上商城:美国服饰品牌
2017/03/15 全球购物
英国女性时尚精品店:THE DRESSING ROOM
2018/05/23 全球购物
科茨沃尔德家居商店:Scotts of Stow
2018/06/29 全球购物
中科方德软件测试面试题
2016/04/21 面试题
入党转预备思想汇报
2014/01/07 职场文书
在校大学生的职业生涯规划书
2014/03/14 职场文书
小学教师个人先进事迹材料
2014/05/17 职场文书
安全员岗位职责范本
2015/04/11 职场文书
毕业生的自我鉴定表范文
2019/05/16 职场文书
MySQL 使用索引扫描进行排序
2021/06/20 MySQL