快速一键生成Python爬虫请求头


Posted in Python onMarch 04, 2021

今天介绍个神奇的网站!堪称爬虫偷懒的神器!

我们在写爬虫,构建网络请求的时候,不可避免地要添加请求头( headers ),以 mdn 学习区为例,我们的请求头是这样的:

快速一键生成Python爬虫请求头

一般来说,我们只要添加 user-agent 就能满足绝大部分需求了,Python 代码如下:

import requests

headers = {
 #'authority': 'developer.mozilla.org',
 #'pragma': 'no-cache',
 #'cache-control': 'no-cache',
 #'upgrade-insecure-requests': '1',
 'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.100 YaBrowser/19.7.0.1635 Yowser/2.5 Safari/537.36',
 #'accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3',
 #'accept-encoding': 'gzip, deflate, br',
 #'accept-language': 'zh-CN,zh-TW;q=0.9,zh;q=0.8,en-US;q=0.7,en;q=0.6',
 #'cookie': 你的cookie,
}

response = requests.get('https://developer.mozilla.org/zh-CN/docs/learn', headers=headers)

但是有些请求,我们要把特定的 headers 参数添加上才能获得正确的网络响应,不知道哪个参数是必要的情况下,就要先把所有参数都添加上,再逐个排除。

但是手动复制粘贴 headers 字典里的每一个键值对太费事了

一个不那么方便的解决方案:

用正则表达式或者直接字符串替换,把 headers 字符串直接转化为字典,封装成函数方便以后反复调用。

有的人喜欢用这种方法,每次复制headers信息,然后调用自己封装好的函数,但我觉得还是挺麻烦的。

那么还有没有快速一键生成 Python 爬虫请求头的方法呢?
这里给大家介绍两个:

  • 网站在线转换
  • Postman

实战演练

抓取网站:https://developer.mozilla.org...

网站在线转换

1,Chrome 打开开发者选项( f12 )---> network 选项卡 ---> 刷新页面,获取请求 ---> 找到页面信息对应的请求 (通过请求的名称、后缀和 response 内容来判断)

快速一键生成Python爬虫请求头

2,右键,copy ---> copy as cURL (bash),注意不是【copy as cURL (cmd)】

快速一键生成Python爬虫请求头

3,打开网站,https://curl.trillworks.com/,粘贴 cURL (bash) 到左边 curl command,右边会自动出 Python 代码

快速一键生成Python爬虫请求头

4,生成代码如下图

快速一键生成Python爬虫请求头

5,print ( response.text ) 就可以直接打印网页源代码啦!

Postman

1,下载 postman ( Chrome 也有个 postman 的插件,操作应该差不多)

2,打开 postman,弹出的界面可以直接关掉

快速一键生成Python爬虫请求头

3,import --> paste raw text,在 Chrome 里复制 curl (bash),粘贴到下面的对话框里,点击 import 按钮

快速一键生成Python爬虫请求头

4,点击 send,模拟网络请求,下方可查看源代码

快速一键生成Python爬虫请求头

5,确保源代码正常后,点击 code

快速一键生成Python爬虫请求头

6,左上角可以选择编程语言,右上角复制到剪贴板

快速一键生成Python爬虫请求头

大功告成!

其实我本人平时都是用第一种,网站比较稳定,基本没出现过异常;有了这个神器就不用自己再构造请求头了,先一键生成,然后再根据需求调一调就好了,几秒钟就搞定了。

以上就是快速一键生成Python爬虫请求头的详细内容,更多关于快速一键生成Python爬虫请求头的资料请关注三水点靠木其它相关文章!

Python 相关文章推荐
python处理圆角图片、圆形图片的例子
Apr 25 Python
介绍Python中内置的itertools模块
Apr 29 Python
Python中IPYTHON入门实例
May 11 Python
打包发布Python模块的方法详解
Sep 18 Python
Python 中的Selenium异常处理实例代码
May 03 Python
如何使用Python标准库进行性能测试
Jun 25 Python
PyQt5 QTableView设置某一列不可编辑的方法
Jun 25 Python
Pandas透视表(pivot_table)详解
Jul 22 Python
Python爬虫 urllib2的使用方法详解
Sep 23 Python
python隐藏类中属性的3种实现方法
Dec 19 Python
PyTorch加载预训练模型实例(pretrained)
Jan 17 Python
Python使用UDP实现720p视频传输的操作
Apr 24 Python
10个顶级Python实用库推荐
Mar 04 #Python
pytorch 把图片数据转化成tensor的操作
Mar 04 #Python
pytorch 计算Parameter和FLOP的操作
Mar 04 #Python
从Pytorch模型pth文件中读取参数成numpy矩阵的操作
Mar 04 #Python
python 如何用urllib与服务端交互(发送和接收数据)
Mar 04 #Python
python 求两个向量的顺时针夹角操作
Mar 04 #Python
python 制作磁力搜索工具
Mar 04 #Python
You might like
php 图片上传类代码
2009/07/17 PHP
深入php数据采集的详解
2013/06/02 PHP
php实现的美国50个州选择列表实例
2015/04/20 PHP
CodeIgniter配置之config.php用法实例分析
2016/01/19 PHP
PHP操作Postgresql封装类与应用完整实例
2018/04/24 PHP
List Information About the Binary Files Used by an Application
2007/06/18 Javascript
js鼠标左右键 键盘值小结
2010/06/11 Javascript
比较不错的JS/JQuery显示或隐藏文本的方法
2014/02/13 Javascript
jquery实现一个简单好用的弹出框
2014/09/26 Javascript
JavaScript中string转换成number介绍
2014/12/31 Javascript
JQuery给网页更换皮肤的方法
2015/05/30 Javascript
jQuery实现图片左右滚动特效
2020/04/20 Javascript
JavaScript中对JSON对象的基本操作示例
2016/05/21 Javascript
浅谈jQuery中的checkbox问题
2016/08/10 Javascript
Select2.js下拉框使用小结
2016/10/24 Javascript
Bootstrap Multiselect 常用组件实现代码
2017/07/09 Javascript
史上最全JavaScript常用的简写技巧(推荐)
2017/08/17 Javascript
node前端模板引擎Jade之标签的基本写法
2018/05/11 Javascript
详解用js代码触发dom事件的实现方案
2020/06/10 Javascript
vue实现购物车的小练习
2020/12/21 Vue.js
[47:06]DOTA2上海特级锦标赛主赛事日 - 4 败者组第五轮 MVP.Phx VS EG第一局
2016/03/05 DOTA
Python基础之函数用法实例详解
2014/09/10 Python
Python中py文件引用另一个py文件变量的方法
2018/04/29 Python
python爬虫之验证码篇3-滑动验证码识别技术
2019/04/11 Python
使用Python串口实时显示数据并绘图的例子
2019/12/26 Python
Python多线程Threading、子线程与守护线程实例详解
2020/03/24 Python
英文自荐信
2013/12/15 职场文书
初中体育教学反思
2014/01/14 职场文书
八年级数学教学反思
2014/01/31 职场文书
素食餐饮项目创业计划书
2014/02/02 职场文书
《中国梦我的梦》中学生演讲稿
2014/08/20 职场文书
求职自我评价范文100字
2014/09/23 职场文书
邀请函怎么写
2015/01/30 职场文书
刘公岛导游词
2015/02/05 职场文书
一篇文章弄懂Python关键字、标识符和变量
2021/07/15 Python
Python尝试实现蒙特卡罗模拟期权定价
2022/04/21 Python