快速一键生成Python爬虫请求头


Posted in Python onMarch 04, 2021

今天介绍个神奇的网站!堪称爬虫偷懒的神器!

我们在写爬虫,构建网络请求的时候,不可避免地要添加请求头( headers ),以 mdn 学习区为例,我们的请求头是这样的:

快速一键生成Python爬虫请求头

一般来说,我们只要添加 user-agent 就能满足绝大部分需求了,Python 代码如下:

import requests

headers = {
 #'authority': 'developer.mozilla.org',
 #'pragma': 'no-cache',
 #'cache-control': 'no-cache',
 #'upgrade-insecure-requests': '1',
 'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.100 YaBrowser/19.7.0.1635 Yowser/2.5 Safari/537.36',
 #'accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3',
 #'accept-encoding': 'gzip, deflate, br',
 #'accept-language': 'zh-CN,zh-TW;q=0.9,zh;q=0.8,en-US;q=0.7,en;q=0.6',
 #'cookie': 你的cookie,
}

response = requests.get('https://developer.mozilla.org/zh-CN/docs/learn', headers=headers)

但是有些请求,我们要把特定的 headers 参数添加上才能获得正确的网络响应,不知道哪个参数是必要的情况下,就要先把所有参数都添加上,再逐个排除。

但是手动复制粘贴 headers 字典里的每一个键值对太费事了

一个不那么方便的解决方案:

用正则表达式或者直接字符串替换,把 headers 字符串直接转化为字典,封装成函数方便以后反复调用。

有的人喜欢用这种方法,每次复制headers信息,然后调用自己封装好的函数,但我觉得还是挺麻烦的。

那么还有没有快速一键生成 Python 爬虫请求头的方法呢?
这里给大家介绍两个:

  • 网站在线转换
  • Postman

实战演练

抓取网站:https://developer.mozilla.org...

网站在线转换

1,Chrome 打开开发者选项( f12 )---> network 选项卡 ---> 刷新页面,获取请求 ---> 找到页面信息对应的请求 (通过请求的名称、后缀和 response 内容来判断)

快速一键生成Python爬虫请求头

2,右键,copy ---> copy as cURL (bash),注意不是【copy as cURL (cmd)】

快速一键生成Python爬虫请求头

3,打开网站,https://curl.trillworks.com/,粘贴 cURL (bash) 到左边 curl command,右边会自动出 Python 代码

快速一键生成Python爬虫请求头

4,生成代码如下图

快速一键生成Python爬虫请求头

5,print ( response.text ) 就可以直接打印网页源代码啦!

Postman

1,下载 postman ( Chrome 也有个 postman 的插件,操作应该差不多)

2,打开 postman,弹出的界面可以直接关掉

快速一键生成Python爬虫请求头

3,import --> paste raw text,在 Chrome 里复制 curl (bash),粘贴到下面的对话框里,点击 import 按钮

快速一键生成Python爬虫请求头

4,点击 send,模拟网络请求,下方可查看源代码

快速一键生成Python爬虫请求头

5,确保源代码正常后,点击 code

快速一键生成Python爬虫请求头

6,左上角可以选择编程语言,右上角复制到剪贴板

快速一键生成Python爬虫请求头

大功告成!

其实我本人平时都是用第一种,网站比较稳定,基本没出现过异常;有了这个神器就不用自己再构造请求头了,先一键生成,然后再根据需求调一调就好了,几秒钟就搞定了。

以上就是快速一键生成Python爬虫请求头的详细内容,更多关于快速一键生成Python爬虫请求头的资料请关注三水点靠木其它相关文章!

Python 相关文章推荐
python文件与目录操作实例详解
Feb 22 Python
python 实现对数据集的归一化的方法(0-1之间)
Jul 17 Python
django模板加载静态文件的方法步骤
Mar 01 Python
Python3实现的判断环形链表算法示例
Mar 07 Python
django框架模板中定义变量(set variable in django template)的方法分析
Jun 24 Python
pandas DataFrame 行列索引及值的获取的方法
Jul 02 Python
python try except返回异常的信息字符串代码实例
Aug 15 Python
pandas中遍历dataframe的每一个元素的实现
Oct 23 Python
python GUI库图形界面开发之PyQt5窗口布局控件QStackedWidget详细使用方法
Feb 27 Python
python中format函数如何使用
Jun 22 Python
Python环境使用OpenCV检测人脸实现教程
Oct 19 Python
OpenCV项目实践之停车场车位实时检测
Apr 11 Python
10个顶级Python实用库推荐
Mar 04 #Python
pytorch 把图片数据转化成tensor的操作
Mar 04 #Python
pytorch 计算Parameter和FLOP的操作
Mar 04 #Python
从Pytorch模型pth文件中读取参数成numpy矩阵的操作
Mar 04 #Python
python 如何用urllib与服务端交互(发送和接收数据)
Mar 04 #Python
python 求两个向量的顺时针夹角操作
Mar 04 #Python
python 制作磁力搜索工具
Mar 04 #Python
You might like
《DOTA3》开发工作已经开始 《DOTA3》将代替《DOTA2》
2021/03/06 DOTA
php cli 方式 在crotab中运行解决
2010/02/08 PHP
smarty基础之拼接字符串的详解
2013/06/18 PHP
CI框架(ajax分页,全选,反选,不选,批量删除)完整代码详解
2016/11/01 PHP
Ubuntu VPS中wordpress网站打开时提示”建立数据库连接错误”的解决办法
2016/11/03 PHP
怎么用javascript进行拖拽
2006/07/20 Javascript
Gird组件 Part-3:范例RSSFeed Viewer
2007/03/10 Javascript
JQuery实现自定义对话框的代码
2008/06/15 Javascript
JS使用getComputedStyle()方法获取CSS属性值
2014/04/23 Javascript
微信JS接口汇总及使用详解
2015/01/09 Javascript
javascript记住用户名和登录密码(两种方式)
2015/08/04 Javascript
基于javascript实现页面加载loading效果
2020/09/15 Javascript
jquery自定义插件——window的实现【示例代码】
2016/05/06 Javascript
Angular使用ng-messages与PHP进行表单数据验证
2016/12/28 Javascript
webpack入门必知必会
2017/01/16 Javascript
微信小程序 视图容器组件的详解及实例代码
2017/01/19 Javascript
VUE长按事件需求详解
2017/10/18 Javascript
vue 实现搜索的结果页面支持全选与取消全选功能
2019/05/10 Javascript
[01:04:48]VGJ.S vs TNC Supermajor 败者组 BO3 第一场 6.6
2018/06/07 DOTA
python实现三维拟合的方法
2018/12/29 Python
python实现H2O中的随机森林算法介绍及其项目实战
2019/08/29 Python
opencv之为图像添加边界的方法示例
2019/12/26 Python
Python3 全自动更新已安装的模块实现
2020/01/06 Python
django 取消csrf限制的实例
2020/03/13 Python
django ListView的使用 ListView中获取url中的参数值方式
2020/03/27 Python
pyinstaller打包单文件时--uac-admin选项不起作用怎么办
2020/04/15 Python
在Pytorch中使用Mask R-CNN进行实例分割操作
2020/06/24 Python
python 贪心算法的实现
2020/09/18 Python
使用html2canvas将页面转成图并使用用canvas2image下载
2019/04/04 HTML / CSS
机电一体化专业推荐信
2013/12/03 职场文书
集体备课反思
2014/02/12 职场文书
推广普通话的宣传语
2015/07/13 职场文书
2015年信息技术教研组工作总结
2015/07/22 职场文书
大学副班长竞选稿
2015/11/21 职场文书
年会邀请函的格式及范文五篇
2019/11/02 职场文书
PyTorch中permute的使用方法
2022/04/26 Python