快速一键生成Python爬虫请求头


Posted in Python onMarch 04, 2021

今天介绍个神奇的网站!堪称爬虫偷懒的神器!

我们在写爬虫,构建网络请求的时候,不可避免地要添加请求头( headers ),以 mdn 学习区为例,我们的请求头是这样的:

快速一键生成Python爬虫请求头

一般来说,我们只要添加 user-agent 就能满足绝大部分需求了,Python 代码如下:

import requests

headers = {
 #'authority': 'developer.mozilla.org',
 #'pragma': 'no-cache',
 #'cache-control': 'no-cache',
 #'upgrade-insecure-requests': '1',
 'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.100 YaBrowser/19.7.0.1635 Yowser/2.5 Safari/537.36',
 #'accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3',
 #'accept-encoding': 'gzip, deflate, br',
 #'accept-language': 'zh-CN,zh-TW;q=0.9,zh;q=0.8,en-US;q=0.7,en;q=0.6',
 #'cookie': 你的cookie,
}

response = requests.get('https://developer.mozilla.org/zh-CN/docs/learn', headers=headers)

但是有些请求,我们要把特定的 headers 参数添加上才能获得正确的网络响应,不知道哪个参数是必要的情况下,就要先把所有参数都添加上,再逐个排除。

但是手动复制粘贴 headers 字典里的每一个键值对太费事了

一个不那么方便的解决方案:

用正则表达式或者直接字符串替换,把 headers 字符串直接转化为字典,封装成函数方便以后反复调用。

有的人喜欢用这种方法,每次复制headers信息,然后调用自己封装好的函数,但我觉得还是挺麻烦的。

那么还有没有快速一键生成 Python 爬虫请求头的方法呢?
这里给大家介绍两个:

  • 网站在线转换
  • Postman

实战演练

抓取网站:https://developer.mozilla.org...

网站在线转换

1,Chrome 打开开发者选项( f12 )---> network 选项卡 ---> 刷新页面,获取请求 ---> 找到页面信息对应的请求 (通过请求的名称、后缀和 response 内容来判断)

快速一键生成Python爬虫请求头

2,右键,copy ---> copy as cURL (bash),注意不是【copy as cURL (cmd)】

快速一键生成Python爬虫请求头

3,打开网站,https://curl.trillworks.com/,粘贴 cURL (bash) 到左边 curl command,右边会自动出 Python 代码

快速一键生成Python爬虫请求头

4,生成代码如下图

快速一键生成Python爬虫请求头

5,print ( response.text ) 就可以直接打印网页源代码啦!

Postman

1,下载 postman ( Chrome 也有个 postman 的插件,操作应该差不多)

2,打开 postman,弹出的界面可以直接关掉

快速一键生成Python爬虫请求头

3,import --> paste raw text,在 Chrome 里复制 curl (bash),粘贴到下面的对话框里,点击 import 按钮

快速一键生成Python爬虫请求头

4,点击 send,模拟网络请求,下方可查看源代码

快速一键生成Python爬虫请求头

5,确保源代码正常后,点击 code

快速一键生成Python爬虫请求头

6,左上角可以选择编程语言,右上角复制到剪贴板

快速一键生成Python爬虫请求头

大功告成!

其实我本人平时都是用第一种,网站比较稳定,基本没出现过异常;有了这个神器就不用自己再构造请求头了,先一键生成,然后再根据需求调一调就好了,几秒钟就搞定了。

以上就是快速一键生成Python爬虫请求头的详细内容,更多关于快速一键生成Python爬虫请求头的资料请关注三水点靠木其它相关文章!

Python 相关文章推荐
Python实现的简单万年历例子分享
Apr 25 Python
Python通过DOM和SAX方式解析XML的应用实例分享
Nov 16 Python
Python使用sftp实现上传和下载功能(实例代码)
Mar 14 Python
python 打印直角三角形,等边三角形,菱形,正方形的代码
Nov 21 Python
python 实现将txt文件多行合并为一行并将中间的空格去掉方法
Dec 20 Python
Python3实现对列表按元组指定列进行排序的方法分析
Dec 22 Python
Python django框架应用中实现获取访问者ip地址示例
May 17 Python
Pytorch中index_select() 函数的实现理解
Nov 19 Python
python pycharm最新版本激活码(永久有效)附python安装教程
Sep 18 Python
Django中的session用法详解
Mar 09 Python
Windows10+anacond+GPU+pytorch安装详细过程
Mar 24 Python
Python日志处理模块logging用法解析
May 19 Python
10个顶级Python实用库推荐
Mar 04 #Python
pytorch 把图片数据转化成tensor的操作
Mar 04 #Python
pytorch 计算Parameter和FLOP的操作
Mar 04 #Python
从Pytorch模型pth文件中读取参数成numpy矩阵的操作
Mar 04 #Python
python 如何用urllib与服务端交互(发送和接收数据)
Mar 04 #Python
python 求两个向量的顺时针夹角操作
Mar 04 #Python
python 制作磁力搜索工具
Mar 04 #Python
You might like
通过php快速统计某个数据库中每张表的数据量
2012/09/04 PHP
一个简单的php加密解密函数(动态加密)
2013/06/19 PHP
smarty模板引擎之内建函数用法
2015/03/30 PHP
CodeIgniter辅助之第三方类库third_party用法分析
2016/01/20 PHP
Javascript 中介者模式实例
2009/12/16 Javascript
jQuery 方法大全方便学习参考
2010/02/25 Javascript
jqGrid读取选择的多行的某个属性代码
2014/05/18 Javascript
JavaScript+html5 canvas制作色彩斑斓的正方形效果
2016/01/27 Javascript
详解JavaScript中数组和字符串的lastIndexOf()方法使用
2016/03/13 Javascript
jQuery progressbar通过Ajax请求实现后台进度实时功能
2016/10/11 Javascript
微信小程序 loading 详解及实例代码
2016/11/09 Javascript
原生JS实现幻灯片
2017/02/22 Javascript
javascript算法之二叉搜索树的示例代码
2017/09/12 Javascript
剖析Angular Component的源码示例
2018/03/23 Javascript
JavaScript实现的九种排序算法
2019/03/04 Javascript
React+Antd+Redux实现待办事件的方法
2019/03/14 Javascript
vue实现倒计时获取验证码效果
2020/04/17 Javascript
vue实现学生信息管理系统
2020/05/30 Javascript
django开发教程之利用缓存文件进行页面缓存的方法
2017/11/10 Python
Python机器学习之决策树算法
2017/12/22 Python
Python利用matplotlib.pyplot绘图时如何设置坐标轴刻度
2018/04/09 Python
Python如何获得百度统计API的数据并发送邮件示例代码
2019/01/27 Python
ipython和python区别详解
2019/06/26 Python
在django-xadmin中APScheduler的启动初始化实例
2019/11/15 Python
HTML5 Plus 实现手机APP拍照或相册选择图片上传功能
2016/07/13 HTML / CSS
澳大利亚小众服装品牌:Maurie & Eve
2018/03/27 全球购物
Travelstart沙特阿拉伯:廉价航班、豪华酒店和实惠的汽车租赁优惠
2019/04/06 全球购物
中东奢侈品市场:Coveti
2019/05/12 全球购物
经典c++面试题二
2015/08/14 面试题
《学会待客》教学反思
2014/02/22 职场文书
校园歌咏比赛主持词
2014/03/18 职场文书
幼儿园教师节演讲稿
2014/09/03 职场文书
义卖募捐活动总结
2015/05/09 职场文书
因公司原因离职的辞职信范文
2015/05/12 职场文书
Python帮你解决手机qq微信内存占用太多问题
2022/02/15 Python
MySQL插入数据与查询数据
2022/03/25 MySQL