Python headers请求头如何实现快速添加


Posted in Python onNovember 03, 2020

1、为什么要设置headers?

在请求网页爬取的时候,输出的text信息中会出现抱歉,无法访问等字眼,这就是禁止爬取,需要通过反爬机制去解决这个问题。

headers是解决requests请求反爬的方法之一,相当于我们进去这个网页的服务器本身,假装自己本身在爬取数据。

对反爬虫网页,可以设置一些headers信息,模拟成浏览器取访问网站 。

2、 headers在哪里找?

谷歌或者火狐浏览器,在网页面上点击:右键?>检查?>剩余按照图中显示操作,需要按Fn+F5刷新出网页来

有的浏览器是点击:右键->查看元素,刷新

Python爬虫中Requests设置请求头Headers的方法

注意:headers中有很多内容,主要常用的就是user-agent 和 host,他们是以键对的形式展现出来,如果user-agent 以字典键对形式作为headers的内容,就可以反爬成功,就不需要其他键对;否则,需要加入headers下的更多键对形式。

代码如下

import re
# 下方引号内添加替换掉请求头内容
headers_str = """
Accept: application/json, text/javascript, */*; q=0.01
Accept-Encoding: gzip, deflate, br
Accept-Language: zh-CN,zh;q=0.9,en;q=0.8
Cache-Control: no-cache
Connection: keep-alive
Content-Length: 77
Content-Type: application/json
User-Agent: Mozilla/5.0 (iPhone; CPU iPhone OS 13_2_3 like Mac OS X) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/13.0.3 Mobile/15E148 Safari/604.1
X-Apple-App-Id: 632
X-Apple-Frame-Id: daw-10beaddd-c22f-4fd4-8aba-ef4909a721dd
X-Requested-With: XMLHttpRequest
"""
pattern = '^(.*?):(.*)$'
for line in headers_str.splitlines():
  print(re.sub(pattern,'\'\\1\':\'\\2\',',line).replace(' ',''))

结果

Python headers请求头如何实现快速添加

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
使用BeautifulSoup爬虫程序获取百度搜索结果的标题和url示例
Jan 19 Python
详解Python的迭代器、生成器以及相关的itertools包
Apr 02 Python
Python中关于使用模块的基础知识
May 24 Python
利用ctypes提高Python的执行速度
Sep 09 Python
Django自定义分页与bootstrap分页结合
Feb 22 Python
python使用pygame框架实现推箱子游戏
Nov 20 Python
pandas实现to_sql将DataFrame保存到数据库中
Jul 03 Python
Python Django Vue 项目创建过程详解
Jul 29 Python
vim自动补全插件YouCompleteMe(YCM)安装过程解析
Oct 21 Python
PyCharm中如何直接使用Anaconda已安装的库
May 28 Python
python相对企业语言优势在哪
Jun 12 Python
python如何停止递归
Sep 09 Python
python time()的实例用法
Nov 03 #Python
Python-openpyxl表格读取写入的案例详解
Nov 02 #Python
Python常用扩展插件使用教程解析
Nov 02 #Python
python实现三壶谜题的示例详解
Nov 02 #Python
python 实现批量图片识别并翻译
Nov 02 #Python
基于python实现百度语音识别和图灵对话
Nov 02 #Python
用python进行视频剪辑
Nov 02 #Python
You might like
谈谈PHP语法(5)
2006/10/09 PHP
php文档更新介绍
2011/07/22 PHP
PHPMailer发送HTML内容、带附件的邮件实例
2014/07/01 PHP
PHP实现模拟http请求的方法分析
2017/12/20 PHP
jQuery 隔行换色 支持键盘上下键,按Enter选定值
2009/08/02 Javascript
javascript 基础篇4 window对象,DOM
2012/03/14 Javascript
angularjs表格分页功能详解
2016/01/21 Javascript
超全面的vue.js使用总结
2017/02/12 Javascript
JavaScript之iterable_动力节点Java学院整理
2017/06/29 Javascript
详谈ES6中的迭代器(Iterator)和生成器(Generator)
2017/07/31 Javascript
详解基于vue-cli配置移动端自适应
2018/01/13 Javascript
webpack4.0+vue2.0利用批处理生成前端单页或多页应用的方法
2019/06/28 Javascript
vue-i18n实现中英文切换的方法
2020/07/06 Javascript
解决pycharm双击但是无法打开的情况
2020/10/31 Javascript
[40:05]LGD vs Winstrike 2018国际邀请赛小组赛BO2 第二场 8.17
2018/08/18 DOTA
[04:46]2018年度玩家喜爱的电竞媒体-完美盛典
2018/12/16 DOTA
python3序列化与反序列化用法实例
2015/05/26 Python
Python多线程和队列操作实例
2015/06/21 Python
Python使用修饰器进行异常日志记录操作示例
2019/03/19 Python
pyQt5实时刷新界面的示例
2019/06/25 Python
python 获取剪切板内容的两种方法
2020/11/28 Python
Python 获取异常(Exception)信息的几种方法
2020/12/29 Python
纯HTML5+CSS3制作图片旋转
2016/01/12 HTML / CSS
html5标记文字_动力节点Java学院整理
2017/07/11 HTML / CSS
销售所有的狗狗产品:Dog.com
2016/10/13 全球购物
女子锻炼服装和瑜伽服装:Splits59
2019/03/04 全球购物
Etam俄罗斯:法国女士内衣和家居服网上商店
2019/10/30 全球购物
医学类导师推荐信范文
2013/11/19 职场文书
企业消防安全制度
2014/02/02 职场文书
2014年冬季防火方案
2014/05/21 职场文书
工地宣传标语
2014/06/18 职场文书
小学生推普周国旗下讲话稿
2014/09/21 职场文书
2019森林防火宣传标语大全!
2019/07/03 职场文书
创业开店,这样方式更合理
2019/08/26 职场文书
JavaScript 语句之常用 for 循环详解
2021/03/29 Javascript
Nginx如何配置根据路径转发详解
2022/07/23 Servers