快速一键生成Python爬虫请求头


Posted in Python onMarch 04, 2021

今天介绍个神奇的网站!堪称爬虫偷懒的神器!

我们在写爬虫,构建网络请求的时候,不可避免地要添加请求头( headers ),以 mdn 学习区为例,我们的请求头是这样的:

快速一键生成Python爬虫请求头

一般来说,我们只要添加 user-agent 就能满足绝大部分需求了,Python 代码如下:

import requests

headers = {
 #'authority': 'developer.mozilla.org',
 #'pragma': 'no-cache',
 #'cache-control': 'no-cache',
 #'upgrade-insecure-requests': '1',
 'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.100 YaBrowser/19.7.0.1635 Yowser/2.5 Safari/537.36',
 #'accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3',
 #'accept-encoding': 'gzip, deflate, br',
 #'accept-language': 'zh-CN,zh-TW;q=0.9,zh;q=0.8,en-US;q=0.7,en;q=0.6',
 #'cookie': 你的cookie,
}

response = requests.get('https://developer.mozilla.org/zh-CN/docs/learn', headers=headers)

但是有些请求,我们要把特定的 headers 参数添加上才能获得正确的网络响应,不知道哪个参数是必要的情况下,就要先把所有参数都添加上,再逐个排除。

但是手动复制粘贴 headers 字典里的每一个键值对太费事了

一个不那么方便的解决方案:

用正则表达式或者直接字符串替换,把 headers 字符串直接转化为字典,封装成函数方便以后反复调用。

有的人喜欢用这种方法,每次复制headers信息,然后调用自己封装好的函数,但我觉得还是挺麻烦的。

那么还有没有快速一键生成 Python 爬虫请求头的方法呢?
这里给大家介绍两个:

  • 网站在线转换
  • Postman

实战演练

抓取网站:https://developer.mozilla.org...

网站在线转换

1,Chrome 打开开发者选项( f12 )---> network 选项卡 ---> 刷新页面,获取请求 ---> 找到页面信息对应的请求 (通过请求的名称、后缀和 response 内容来判断)

快速一键生成Python爬虫请求头

2,右键,copy ---> copy as cURL (bash),注意不是【copy as cURL (cmd)】

快速一键生成Python爬虫请求头

3,打开网站,https://curl.trillworks.com/,粘贴 cURL (bash) 到左边 curl command,右边会自动出 Python 代码

快速一键生成Python爬虫请求头

4,生成代码如下图

快速一键生成Python爬虫请求头

5,print ( response.text ) 就可以直接打印网页源代码啦!

Postman

1,下载 postman ( Chrome 也有个 postman 的插件,操作应该差不多)

2,打开 postman,弹出的界面可以直接关掉

快速一键生成Python爬虫请求头

3,import --> paste raw text,在 Chrome 里复制 curl (bash),粘贴到下面的对话框里,点击 import 按钮

快速一键生成Python爬虫请求头

4,点击 send,模拟网络请求,下方可查看源代码

快速一键生成Python爬虫请求头

5,确保源代码正常后,点击 code

快速一键生成Python爬虫请求头

6,左上角可以选择编程语言,右上角复制到剪贴板

快速一键生成Python爬虫请求头

大功告成!

其实我本人平时都是用第一种,网站比较稳定,基本没出现过异常;有了这个神器就不用自己再构造请求头了,先一键生成,然后再根据需求调一调就好了,几秒钟就搞定了。

以上就是快速一键生成Python爬虫请求头的详细内容,更多关于快速一键生成Python爬虫请求头的资料请关注三水点靠木其它相关文章!

Python 相关文章推荐
Python脚本实现下载合并SAE日志
Feb 10 Python
Python基于Tkinter实现的记事本实例
Jun 17 Python
Django中对数据查询结果进行排序的方法
Jul 17 Python
python框架django基础指南
Sep 08 Python
python微信公众号之关键词自动回复
Jun 15 Python
Python实现多线程的两种方式分析
Aug 29 Python
如何在django里上传csv文件并进行入库处理的方法
Jan 02 Python
Python 操作 ElasticSearch的完整代码
Aug 04 Python
简单了解为什么python函数后有多个括号
Dec 19 Python
Ubuntu16.04安装python3.6.5步骤详解
Jan 10 Python
Python3操作读写CSV文件使用包过程解析
Apr 10 Python
python基于pygame实现飞机大作战小游戏
Nov 19 Python
10个顶级Python实用库推荐
Mar 04 #Python
pytorch 把图片数据转化成tensor的操作
Mar 04 #Python
pytorch 计算Parameter和FLOP的操作
Mar 04 #Python
从Pytorch模型pth文件中读取参数成numpy矩阵的操作
Mar 04 #Python
python 如何用urllib与服务端交互(发送和接收数据)
Mar 04 #Python
python 求两个向量的顺时针夹角操作
Mar 04 #Python
python 制作磁力搜索工具
Mar 04 #Python
You might like
Windows下利用Gvim写PHP产生中文乱码问题解决方法
2011/04/20 PHP
PHP封装的数据库模型Model类完整示例【基于PDO】
2019/03/14 PHP
JavaScript中的数组操作介绍
2014/12/30 Javascript
jQuery中map()方法用法实例
2015/01/06 Javascript
Jquery实现鼠标移动放大图片功能实例
2015/03/25 Javascript
jquery实现的Accordion折叠面板效果代码
2015/09/02 Javascript
input获取焦点时底部菜单被顶上来问题的解决办法
2017/01/24 Javascript
jQuery插件FusionCharts绘制的3D环饼图效果示例【附demo源码】
2017/04/02 jQuery
echarts学习笔记之箱线图的分析与绘制详解
2017/11/22 Javascript
vue根据进入的路由进行原路返回的方法
2018/09/26 Javascript
微信小程序websocket实现即时聊天功能
2019/05/21 Javascript
微信小程序实现一个简单swiper代码实例
2019/12/30 Javascript
Vue的data、computed、watch源码浅谈
2020/04/04 Javascript
python ip正则式
2009/05/07 Python
Python实用日期时间处理方法汇总
2015/05/09 Python
为什么选择python编程语言入门黑客攻防 给你几个理由!
2018/02/02 Python
TensorFlow实现Softmax回归模型
2018/03/09 Python
python通过伪装头部数据抵抗反爬虫的实例
2018/05/07 Python
Python实现的线性回归算法示例【附csv文件下载】
2018/12/29 Python
python 去除二维数组/二维列表中的重复行方法
2019/01/23 Python
python3实现微型的web服务器
2019/09/03 Python
用什么库写 Python 命令行程序(示例代码详解)
2020/02/20 Python
html5 touch事件实现触屏页面上下滑动(一)
2016/03/10 HTML / CSS
HTML5操作WebSQL数据库的实例代码
2017/08/26 HTML / CSS
时尚孕妇装:Ingrid & Isabel
2019/05/08 全球购物
英国汽车零件购物网站:GSF Car Parts
2019/05/23 全球购物
蔻驰英国官网:COACH英国
2020/07/19 全球购物
新闻记者个人求职的自我评价
2013/11/28 职场文书
银行领导证婚词
2014/01/11 职场文书
自我鉴定写作要点
2014/01/17 职场文书
给客户的检讨书
2014/12/21 职场文书
家长会欢迎词
2015/01/23 职场文书
旷课检讨书
2015/01/26 职场文书
2016元旦晚会主持词
2015/07/01 职场文书
初中语文教学反思范文
2016/03/03 职场文书
Python用tkinter实现自定义记事本的方法详解
2022/03/31 Python