Python headers请求头如何实现快速添加


Posted in Python onNovember 03, 2020

1、为什么要设置headers?

在请求网页爬取的时候,输出的text信息中会出现抱歉,无法访问等字眼,这就是禁止爬取,需要通过反爬机制去解决这个问题。

headers是解决requests请求反爬的方法之一,相当于我们进去这个网页的服务器本身,假装自己本身在爬取数据。

对反爬虫网页,可以设置一些headers信息,模拟成浏览器取访问网站 。

2、 headers在哪里找?

谷歌或者火狐浏览器,在网页面上点击:右键?>检查?>剩余按照图中显示操作,需要按Fn+F5刷新出网页来

有的浏览器是点击:右键->查看元素,刷新

Python爬虫中Requests设置请求头Headers的方法

注意:headers中有很多内容,主要常用的就是user-agent 和 host,他们是以键对的形式展现出来,如果user-agent 以字典键对形式作为headers的内容,就可以反爬成功,就不需要其他键对;否则,需要加入headers下的更多键对形式。

代码如下

import re
# 下方引号内添加替换掉请求头内容
headers_str = """
Accept: application/json, text/javascript, */*; q=0.01
Accept-Encoding: gzip, deflate, br
Accept-Language: zh-CN,zh;q=0.9,en;q=0.8
Cache-Control: no-cache
Connection: keep-alive
Content-Length: 77
Content-Type: application/json
User-Agent: Mozilla/5.0 (iPhone; CPU iPhone OS 13_2_3 like Mac OS X) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/13.0.3 Mobile/15E148 Safari/604.1
X-Apple-App-Id: 632
X-Apple-Frame-Id: daw-10beaddd-c22f-4fd4-8aba-ef4909a721dd
X-Requested-With: XMLHttpRequest
"""
pattern = '^(.*?):(.*)$'
for line in headers_str.splitlines():
  print(re.sub(pattern,'\'\\1\':\'\\2\',',line).replace(' ',''))

结果

Python headers请求头如何实现快速添加

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Eclipse + Python 的安装与配置流程
Mar 05 Python
跟老齐学Python之集合的关系
Sep 24 Python
在Python中marshal对象序列化的相关知识
Jul 01 Python
深入学习python的yield和generator
Mar 10 Python
Windows环境下python环境安装使用图文教程
Mar 13 Python
python中实现将多个print输出合成一个数组
Apr 19 Python
Anaconda下配置python+opencv+contribx的实例讲解
Aug 06 Python
Python利用pandas处理Excel数据的应用详解
Jun 18 Python
Django ORM 查询管理器源码解析
Aug 05 Python
Python PIL图片添加字体的例子
Aug 22 Python
将不规则的Python多维数组拉平到一维的方法实现
Jan 11 Python
如何通过一篇文章了解Python中的生成器
Apr 02 Python
python time()的实例用法
Nov 03 #Python
Python-openpyxl表格读取写入的案例详解
Nov 02 #Python
Python常用扩展插件使用教程解析
Nov 02 #Python
python实现三壶谜题的示例详解
Nov 02 #Python
python 实现批量图片识别并翻译
Nov 02 #Python
基于python实现百度语音识别和图灵对话
Nov 02 #Python
用python进行视频剪辑
Nov 02 #Python
You might like
DC动漫人物排行
2020/03/03 欧美动漫
php实现httpclient类示例
2014/04/08 PHP
PHP中使用glob函数实现一句话删除某个目录下的所有文件
2014/07/22 PHP
php中的异常和错误浅析
2017/05/03 PHP
jquery cookie插件代码类
2009/05/26 Javascript
一些主流JS框架中DOMReady事件的实现小结
2011/02/12 Javascript
分享27款非常棒的jQuery 表单插件
2011/03/28 Javascript
JavaScript的漂亮的代码片段
2013/06/05 Javascript
jquery制作居中遮罩层效果分享
2014/02/21 Javascript
捕获和分析JavaScript Error的方法
2014/03/25 Javascript
javascript实现Table间隔色以及选择高亮(和动态切换数据)的方法
2015/05/14 Javascript
JS实现自动切换文字的导航效果代码
2015/08/27 Javascript
jquery选择器中的空格与大于号>、加号+与波浪号~的区别介绍
2016/06/24 Javascript
新入门node.js必须要知道的概念(必看篇)
2016/08/10 Javascript
less简单入门(CSS 预处理语言)
2017/03/08 Javascript
jQuery实现简单漂亮的Nav导航菜单效果
2017/03/29 jQuery
bootstrap轮播模板使用方法详解
2017/11/17 Javascript
浅谈PDF.js使用心得
2018/06/07 Javascript
解决element ui select下拉框不回显数据问题的解决
2019/02/20 Javascript
vue路由跳转传参数的方法
2019/05/06 Javascript
详解利用nodejs对本地json文件进行增删改查
2019/09/20 NodeJs
[02:49]2018DOTA2亚洲邀请赛主赛事决赛日战况回顾 Mineski鏖战5局夺得辉耀
2018/04/10 DOTA
解析Mac OS下部署Pyhton的Django框架项目的过程
2016/05/03 Python
Python 3实战爬虫之爬取京东图书的图片详解
2017/10/09 Python
Python Selenium 之关闭窗口close与quit的方法
2019/02/13 Python
python SVM 线性分类模型的实现
2019/07/19 Python
django+echart数据动态显示的例子
2019/08/12 Python
Python3 Click模块的使用方法详解
2020/02/12 Python
python中读入二维csv格式的表格方法详解(以元组/列表形式表示)
2020/04/24 Python
pycharm中选中一个单词替换所有重复单词的实现方法
2020/11/17 Python
Html5移动端获奖无缝滚动动画实现示例
2018/06/25 HTML / CSS
计算机考试作弊检讨书1000字
2015/01/01 职场文书
二手车转让协议书
2015/01/29 职场文书
世界气象日活动总结
2015/02/27 职场文书
张丽莉观后感
2015/06/16 职场文书
董事长开业致辞
2015/07/29 职场文书