快速一键生成Python爬虫请求头


Posted in Python onMarch 04, 2021

今天介绍个神奇的网站!堪称爬虫偷懒的神器!

我们在写爬虫,构建网络请求的时候,不可避免地要添加请求头( headers ),以 mdn 学习区为例,我们的请求头是这样的:

快速一键生成Python爬虫请求头

一般来说,我们只要添加 user-agent 就能满足绝大部分需求了,Python 代码如下:

import requests

headers = {
 #'authority': 'developer.mozilla.org',
 #'pragma': 'no-cache',
 #'cache-control': 'no-cache',
 #'upgrade-insecure-requests': '1',
 'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.100 YaBrowser/19.7.0.1635 Yowser/2.5 Safari/537.36',
 #'accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3',
 #'accept-encoding': 'gzip, deflate, br',
 #'accept-language': 'zh-CN,zh-TW;q=0.9,zh;q=0.8,en-US;q=0.7,en;q=0.6',
 #'cookie': 你的cookie,
}

response = requests.get('https://developer.mozilla.org/zh-CN/docs/learn', headers=headers)

但是有些请求,我们要把特定的 headers 参数添加上才能获得正确的网络响应,不知道哪个参数是必要的情况下,就要先把所有参数都添加上,再逐个排除。

但是手动复制粘贴 headers 字典里的每一个键值对太费事了

一个不那么方便的解决方案:

用正则表达式或者直接字符串替换,把 headers 字符串直接转化为字典,封装成函数方便以后反复调用。

有的人喜欢用这种方法,每次复制headers信息,然后调用自己封装好的函数,但我觉得还是挺麻烦的。

那么还有没有快速一键生成 Python 爬虫请求头的方法呢?
这里给大家介绍两个:

  • 网站在线转换
  • Postman

实战演练

抓取网站:https://developer.mozilla.org...

网站在线转换

1,Chrome 打开开发者选项( f12 )---> network 选项卡 ---> 刷新页面,获取请求 ---> 找到页面信息对应的请求 (通过请求的名称、后缀和 response 内容来判断)

快速一键生成Python爬虫请求头

2,右键,copy ---> copy as cURL (bash),注意不是【copy as cURL (cmd)】

快速一键生成Python爬虫请求头

3,打开网站,https://curl.trillworks.com/,粘贴 cURL (bash) 到左边 curl command,右边会自动出 Python 代码

快速一键生成Python爬虫请求头

4,生成代码如下图

快速一键生成Python爬虫请求头

5,print ( response.text ) 就可以直接打印网页源代码啦!

Postman

1,下载 postman ( Chrome 也有个 postman 的插件,操作应该差不多)

2,打开 postman,弹出的界面可以直接关掉

快速一键生成Python爬虫请求头

3,import --> paste raw text,在 Chrome 里复制 curl (bash),粘贴到下面的对话框里,点击 import 按钮

快速一键生成Python爬虫请求头

4,点击 send,模拟网络请求,下方可查看源代码

快速一键生成Python爬虫请求头

5,确保源代码正常后,点击 code

快速一键生成Python爬虫请求头

6,左上角可以选择编程语言,右上角复制到剪贴板

快速一键生成Python爬虫请求头

大功告成!

其实我本人平时都是用第一种,网站比较稳定,基本没出现过异常;有了这个神器就不用自己再构造请求头了,先一键生成,然后再根据需求调一调就好了,几秒钟就搞定了。

以上就是快速一键生成Python爬虫请求头的详细内容,更多关于快速一键生成Python爬虫请求头的资料请关注三水点靠木其它相关文章!

Python 相关文章推荐
Python操作sqlite3快速、安全插入数据(防注入)的实例
Apr 26 Python
python和C语言混合编程实例
Jun 04 Python
Python使用tablib生成excel文件的简单实现方法
Mar 16 Python
Python生成8位随机字符串的方法分析
Dec 05 Python
python 实现判断ip连通性的方法总结
Apr 22 Python
使用python接入微信聊天机器人
Mar 31 Python
opencv3/C++ 平面对象识别&透视变换方式
Dec 11 Python
使用python实现名片管理系统
Jun 18 Python
完美解决keras 读取多个hdf5文件进行训练的问题
Jul 01 Python
Matplotlib中rcParams使用方法
Jan 05 Python
用Python实现屏幕截图详解
Jan 22 Python
python神经网络学习 使用Keras进行简单分类
May 04 Python
10个顶级Python实用库推荐
Mar 04 #Python
pytorch 把图片数据转化成tensor的操作
Mar 04 #Python
pytorch 计算Parameter和FLOP的操作
Mar 04 #Python
从Pytorch模型pth文件中读取参数成numpy矩阵的操作
Mar 04 #Python
python 如何用urllib与服务端交互(发送和接收数据)
Mar 04 #Python
python 求两个向量的顺时针夹角操作
Mar 04 #Python
python 制作磁力搜索工具
Mar 04 #Python
You might like
PHP环境搭建最新方法
2006/09/05 PHP
php 页面执行时间计算代码
2008/12/04 PHP
php mysql_real_escape_string函数用法与实例教程
2013/09/30 PHP
Yii2.0建立公共方法简单示例
2019/01/29 PHP
js 跨域和ajax 跨域问题小结
2009/07/01 Javascript
Javascript创建Silverlight Plugin以及自定义nonSilverlight和lowSilverlight样式
2010/06/28 Javascript
JS实现模仿微博发布效果实例代码
2013/12/16 Javascript
HTML页面登录时的JS验证方法
2014/05/28 Javascript
jquery实现的Banner广告收缩效果代码
2015/09/02 Javascript
javascript数组遍历的方法实例分析
2016/09/13 Javascript
深入理解jquery中的each用法
2016/12/14 Javascript
通俗解释JavaScript正则表达式快速记忆
2017/08/23 Javascript
初探js和简单隐藏效果的实例
2017/11/23 Javascript
浏览器调试动态js脚本的方法(图解)
2018/01/19 Javascript
js删除数组中的元素delete和splice的区别详解
2018/02/03 Javascript
使用vue-cli打包过程中的步骤以及问题的解决
2018/05/08 Javascript
Vue.js点击切换按钮改变内容的实例讲解
2018/08/22 Javascript
Vue常用API、高级API的相关总结
2021/02/02 Vue.js
[05:06]2017亚洲邀请赛DAC回顾片
2017/04/19 DOTA
浅谈利用numpy对矩阵进行归一化处理的方法
2018/07/11 Python
老生常谈python中的重载
2018/11/11 Python
Python爬虫实现验证码登录代码实例
2019/05/10 Python
Django 拆分model和view的实现方法
2019/08/16 Python
Python实现把多维数组展开成DataFrame
2019/11/30 Python
Python Scrapy多页数据爬取实现过程解析
2020/06/12 Python
Python操控mysql批量插入数据的实现方法
2020/10/27 Python
销售高级职员求职信
2013/10/29 职场文书
五四青年节的活动方案
2014/08/20 职场文书
调研座谈会发言材料
2014/08/23 职场文书
纪念一二九运动演讲稿
2014/09/16 职场文书
党员个人批评与自我批评
2014/10/14 职场文书
2015年个人实习工作总结
2014/12/12 职场文书
2015清明节祭奠英烈寄语大全
2015/03/04 职场文书
毕业论文答辩开场白
2015/05/27 职场文书
如何理解python接口自动化之logging日志模块
2021/06/15 Python
仅仅使用 HTML/CSS 实现各类进度条的方式汇总
2021/11/11 HTML / CSS