Python headers请求头如何实现快速添加


Posted in Python onNovember 03, 2020

1、为什么要设置headers?

在请求网页爬取的时候,输出的text信息中会出现抱歉,无法访问等字眼,这就是禁止爬取,需要通过反爬机制去解决这个问题。

headers是解决requests请求反爬的方法之一,相当于我们进去这个网页的服务器本身,假装自己本身在爬取数据。

对反爬虫网页,可以设置一些headers信息,模拟成浏览器取访问网站 。

2、 headers在哪里找?

谷歌或者火狐浏览器,在网页面上点击:右键?>检查?>剩余按照图中显示操作,需要按Fn+F5刷新出网页来

有的浏览器是点击:右键->查看元素,刷新

Python爬虫中Requests设置请求头Headers的方法

注意:headers中有很多内容,主要常用的就是user-agent 和 host,他们是以键对的形式展现出来,如果user-agent 以字典键对形式作为headers的内容,就可以反爬成功,就不需要其他键对;否则,需要加入headers下的更多键对形式。

代码如下

import re
# 下方引号内添加替换掉请求头内容
headers_str = """
Accept: application/json, text/javascript, */*; q=0.01
Accept-Encoding: gzip, deflate, br
Accept-Language: zh-CN,zh;q=0.9,en;q=0.8
Cache-Control: no-cache
Connection: keep-alive
Content-Length: 77
Content-Type: application/json
User-Agent: Mozilla/5.0 (iPhone; CPU iPhone OS 13_2_3 like Mac OS X) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/13.0.3 Mobile/15E148 Safari/604.1
X-Apple-App-Id: 632
X-Apple-Frame-Id: daw-10beaddd-c22f-4fd4-8aba-ef4909a721dd
X-Requested-With: XMLHttpRequest
"""
pattern = '^(.*?):(.*)$'
for line in headers_str.splitlines():
  print(re.sub(pattern,'\'\\1\':\'\\2\',',line).replace(' ',''))

结果

Python headers请求头如何实现快速添加

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python中for循环详解
Jan 17 Python
Python引用模块和查找模块路径
Mar 17 Python
Python基于回溯法解决01背包问题实例
Dec 06 Python
python opencv 图像尺寸变换方法
Apr 02 Python
Python学习笔记之Break和Continue用法分析
Aug 14 Python
python 并发编程 阻塞IO模型原理解析
Aug 20 Python
python实现批量文件重命名
Oct 31 Python
python matplotlib 画dataframe的时间序列图实例
Nov 20 Python
TensorFlow dataset.shuffle、batch、repeat的使用详解
Jan 21 Python
Python 实现一个计时器
Jul 28 Python
Pycharm自动添加文件头注释和函数注释参数的方法
Oct 23 Python
python自动化发送邮件实例讲解
Jan 04 Python
python time()的实例用法
Nov 03 #Python
Python-openpyxl表格读取写入的案例详解
Nov 02 #Python
Python常用扩展插件使用教程解析
Nov 02 #Python
python实现三壶谜题的示例详解
Nov 02 #Python
python 实现批量图片识别并翻译
Nov 02 #Python
基于python实现百度语音识别和图灵对话
Nov 02 #Python
用python进行视频剪辑
Nov 02 #Python
You might like
PHP开发过程中常用函数收藏
2009/12/14 PHP
php版微信小店调用api示例代码
2016/11/12 PHP
js监听输入框值的即时变化onpropertychange、oninput
2011/07/13 Javascript
JS实现根据出生年月计算年龄
2014/01/10 Javascript
jQuery瀑布流插件Wookmark使用实例
2014/04/02 Javascript
通过JQuery将DIV的滚动条滚动到指定的位置方便自动定位
2014/05/05 Javascript
在JavaScript中如何解决用execCommand(
2015/10/19 Javascript
Bootstrap基本插件学习笔记之折叠(22)
2016/12/08 Javascript
bootstrap select插件封装成Vue2.0组件
2017/04/17 Javascript
ES6学习之变量的两种命名方法示例
2017/07/18 Javascript
JS HTML图片显示Canvas 压缩功能
2017/07/21 Javascript
Node.js 基础教程之全局对象
2017/08/06 Javascript
Nodejs 和 Electron ubuntu下快速安装过程
2018/05/04 NodeJs
利用jqgrid实现上移下移单元格功能
2018/11/07 Javascript
vue组件实践之可搜索下拉框功能
2018/11/25 Javascript
这应该是最详细的响应式系统讲解了
2019/07/22 Javascript
vue跳转同一个组件,参数不同,页面接收值只接收一次的解决方法
2019/11/05 Javascript
实现vuex原理的示例
2020/10/21 Javascript
在keras中获取某一层上的feature map实例
2020/01/24 Python
python继承threading.Thread实现有返回值的子类实例
2020/05/02 Python
Ted Baker美国官网:英国时尚品牌
2018/10/29 全球购物
优秀护士获奖感言
2014/02/20 职场文书
清扬洗发水广告词
2014/03/14 职场文书
应届大专毕业生自我鉴定
2014/04/08 职场文书
协议书格式
2014/04/23 职场文书
广告艺术设计专业自荐书
2014/07/08 职场文书
英语课外活动总结
2014/08/27 职场文书
党的群众路线教育实践活动个人整改方案
2014/10/25 职场文书
工作自我推荐信范文
2015/03/25 职场文书
给下属加薪申请报告
2015/05/15 职场文书
2016年国陪研修感言
2015/11/18 职场文书
班委竞选稿范文
2015/11/21 职场文书
2016年第十九届推普周活动总结
2016/04/06 职场文书
护理专业毕业自我鉴定
2019/08/12 职场文书
创业计划书之便利店
2019/09/05 职场文书
go goth封装第三方认证库示例详解
2022/08/14 Golang