快速一键生成Python爬虫请求头


Posted in Python onMarch 04, 2021

今天介绍个神奇的网站!堪称爬虫偷懒的神器!

我们在写爬虫,构建网络请求的时候,不可避免地要添加请求头( headers ),以 mdn 学习区为例,我们的请求头是这样的:

快速一键生成Python爬虫请求头

一般来说,我们只要添加 user-agent 就能满足绝大部分需求了,Python 代码如下:

import requests

headers = {
 #'authority': 'developer.mozilla.org',
 #'pragma': 'no-cache',
 #'cache-control': 'no-cache',
 #'upgrade-insecure-requests': '1',
 'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.100 YaBrowser/19.7.0.1635 Yowser/2.5 Safari/537.36',
 #'accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3',
 #'accept-encoding': 'gzip, deflate, br',
 #'accept-language': 'zh-CN,zh-TW;q=0.9,zh;q=0.8,en-US;q=0.7,en;q=0.6',
 #'cookie': 你的cookie,
}

response = requests.get('https://developer.mozilla.org/zh-CN/docs/learn', headers=headers)

但是有些请求,我们要把特定的 headers 参数添加上才能获得正确的网络响应,不知道哪个参数是必要的情况下,就要先把所有参数都添加上,再逐个排除。

但是手动复制粘贴 headers 字典里的每一个键值对太费事了

一个不那么方便的解决方案:

用正则表达式或者直接字符串替换,把 headers 字符串直接转化为字典,封装成函数方便以后反复调用。

有的人喜欢用这种方法,每次复制headers信息,然后调用自己封装好的函数,但我觉得还是挺麻烦的。

那么还有没有快速一键生成 Python 爬虫请求头的方法呢?
这里给大家介绍两个:

  • 网站在线转换
  • Postman

实战演练

抓取网站:https://developer.mozilla.org...

网站在线转换

1,Chrome 打开开发者选项( f12 )---> network 选项卡 ---> 刷新页面,获取请求 ---> 找到页面信息对应的请求 (通过请求的名称、后缀和 response 内容来判断)

快速一键生成Python爬虫请求头

2,右键,copy ---> copy as cURL (bash),注意不是【copy as cURL (cmd)】

快速一键生成Python爬虫请求头

3,打开网站,https://curl.trillworks.com/,粘贴 cURL (bash) 到左边 curl command,右边会自动出 Python 代码

快速一键生成Python爬虫请求头

4,生成代码如下图

快速一键生成Python爬虫请求头

5,print ( response.text ) 就可以直接打印网页源代码啦!

Postman

1,下载 postman ( Chrome 也有个 postman 的插件,操作应该差不多)

2,打开 postman,弹出的界面可以直接关掉

快速一键生成Python爬虫请求头

3,import --> paste raw text,在 Chrome 里复制 curl (bash),粘贴到下面的对话框里,点击 import 按钮

快速一键生成Python爬虫请求头

4,点击 send,模拟网络请求,下方可查看源代码

快速一键生成Python爬虫请求头

5,确保源代码正常后,点击 code

快速一键生成Python爬虫请求头

6,左上角可以选择编程语言,右上角复制到剪贴板

快速一键生成Python爬虫请求头

大功告成!

其实我本人平时都是用第一种,网站比较稳定,基本没出现过异常;有了这个神器就不用自己再构造请求头了,先一键生成,然后再根据需求调一调就好了,几秒钟就搞定了。

以上就是快速一键生成Python爬虫请求头的详细内容,更多关于快速一键生成Python爬虫请求头的资料请关注三水点靠木其它相关文章!

Python 相关文章推荐
仅利用30行Python代码来展示X算法
Apr 01 Python
Windows中安装使用Virtualenv来创建独立Python环境
May 31 Python
Python中list初始化方法示例
Sep 18 Python
python定时利用QQ邮件发送天气预报的实例
Nov 17 Python
Python中optparser库用法实例详解
Jan 26 Python
Python中的单继承与多继承实例分析
May 10 Python
使用Python读取二进制文件的实例讲解
Jul 09 Python
python 除法保留两位小数点的方法
Jul 16 Python
使用 Python 实现文件递归遍历的三种方式
Jul 18 Python
Python重新加载模块的实现方法
Oct 16 Python
python使用magic模块进行文件类型识别方法
Dec 08 Python
python多线程抽象编程模型详解
Mar 20 Python
10个顶级Python实用库推荐
Mar 04 #Python
pytorch 把图片数据转化成tensor的操作
Mar 04 #Python
pytorch 计算Parameter和FLOP的操作
Mar 04 #Python
从Pytorch模型pth文件中读取参数成numpy矩阵的操作
Mar 04 #Python
python 如何用urllib与服务端交互(发送和接收数据)
Mar 04 #Python
python 求两个向量的顺时针夹角操作
Mar 04 #Python
python 制作磁力搜索工具
Mar 04 #Python
You might like
咖啡的植物学知识
2021/03/03 咖啡文化
一篇不错的PHP基础学习笔记
2007/03/18 PHP
php session劫持和防范的方法
2013/11/12 PHP
实现在同一方法中获取当前方法中新赋值的session值解决方法
2014/06/26 PHP
CodeIgniter中使用cookie的三种方式详解
2014/07/18 PHP
ThinkPHP3.2.2实现持久登录(记住我)功能的方法
2016/05/16 PHP
thinkPHP和onethink微信支付插件分享
2019/08/11 PHP
在Javascript中定义对象类别
2006/12/22 Javascript
原创javascript小游戏实现代码
2010/08/19 Javascript
图片翻转效果具体实现代码
2014/01/09 Javascript
jquery form 加载数据示例
2014/04/21 Javascript
jQuery前端分页示例分享
2015/02/10 Javascript
javascript实现网页端解压并查看zip文件
2015/12/15 Javascript
深入浅析javascript继承体系
2017/10/23 Javascript
在React 组件中使用Echarts的示例代码
2017/11/08 Javascript
VueAwesomeSwiper在VUE中的使用以及遇到的一些问题
2018/01/11 Javascript
Bootstrap Fileinput 4.4.7文件上传实例详解
2018/07/25 Javascript
Bootstrap4 gulp 配置详解
2019/01/06 Javascript
9个JavaScript日常开发小技巧
2020/10/06 Javascript
Python中删除文件的程序代码
2011/03/13 Python
Python实现远程调用MetaSploit的方法
2014/08/22 Python
Python中getattr函数和hasattr函数作用详解
2016/06/14 Python
Python基于正则表达式实现文件内容替换的方法
2017/08/30 Python
Python日期时间模块datetime详解与Python 日期时间的比较,计算实例代码
2018/09/14 Python
Python直接赋值、浅拷贝与深度拷贝实例分析
2019/06/18 Python
Django打印出在数据库中执行的语句问题
2019/07/25 Python
Python 求数组局部最大值的实例
2019/11/26 Python
python批量处理txt文件的实例代码
2020/01/13 Python
python 实现性别识别
2020/11/21 Python
努比亚手机官网:nubia
2016/10/06 全球购物
Expedia挪威官网:酒店、机票和租车
2018/03/03 全球购物
护理中职生求职信范文
2014/02/24 职场文书
地球物理学专业推荐信
2014/09/08 职场文书
公司总经理岗位职责
2015/04/01 职场文书
导游词之宿迁乾隆行宫
2019/10/15 职场文书
flex布局中使用flex-wrap实现换行的项目实践
2022/06/21 HTML / CSS