Python headers请求头如何实现快速添加


Posted in Python onNovember 03, 2020

1、为什么要设置headers?

在请求网页爬取的时候,输出的text信息中会出现抱歉,无法访问等字眼,这就是禁止爬取,需要通过反爬机制去解决这个问题。

headers是解决requests请求反爬的方法之一,相当于我们进去这个网页的服务器本身,假装自己本身在爬取数据。

对反爬虫网页,可以设置一些headers信息,模拟成浏览器取访问网站 。

2、 headers在哪里找?

谷歌或者火狐浏览器,在网页面上点击:右键?>检查?>剩余按照图中显示操作,需要按Fn+F5刷新出网页来

有的浏览器是点击:右键->查看元素,刷新

Python爬虫中Requests设置请求头Headers的方法

注意:headers中有很多内容,主要常用的就是user-agent 和 host,他们是以键对的形式展现出来,如果user-agent 以字典键对形式作为headers的内容,就可以反爬成功,就不需要其他键对;否则,需要加入headers下的更多键对形式。

代码如下

import re
# 下方引号内添加替换掉请求头内容
headers_str = """
Accept: application/json, text/javascript, */*; q=0.01
Accept-Encoding: gzip, deflate, br
Accept-Language: zh-CN,zh;q=0.9,en;q=0.8
Cache-Control: no-cache
Connection: keep-alive
Content-Length: 77
Content-Type: application/json
User-Agent: Mozilla/5.0 (iPhone; CPU iPhone OS 13_2_3 like Mac OS X) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/13.0.3 Mobile/15E148 Safari/604.1
X-Apple-App-Id: 632
X-Apple-Frame-Id: daw-10beaddd-c22f-4fd4-8aba-ef4909a721dd
X-Requested-With: XMLHttpRequest
"""
pattern = '^(.*?):(.*)$'
for line in headers_str.splitlines():
  print(re.sub(pattern,'\'\\1\':\'\\2\',',line).replace(' ',''))

结果

Python headers请求头如何实现快速添加

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
使用Python对Access读写操作
Mar 30 Python
分数霸榜! python助你微信跳一跳拿高分
Jan 08 Python
详解Python核心对象类型字符串
Feb 11 Python
解决Django数据库makemigrations有变化但是migrate时未变动问题
May 30 Python
python使用for循环计算0-100的整数的和方法
Feb 01 Python
总结Python图形用户界面和游戏开发知识点
May 22 Python
python 字符串追加实例
Jul 20 Python
python matplotlib 画dataframe的时间序列图实例
Nov 20 Python
python 中值滤波,椒盐去噪,图片增强实例
Dec 18 Python
常用python爬虫库介绍与简要说明
Jan 25 Python
Django项目如何正确配置日志(logging)
Apr 29 Python
梳理总结Python开发中需要摒弃的18个坏习惯
Jan 22 Python
python time()的实例用法
Nov 03 #Python
Python-openpyxl表格读取写入的案例详解
Nov 02 #Python
Python常用扩展插件使用教程解析
Nov 02 #Python
python实现三壶谜题的示例详解
Nov 02 #Python
python 实现批量图片识别并翻译
Nov 02 #Python
基于python实现百度语音识别和图灵对话
Nov 02 #Python
用python进行视频剪辑
Nov 02 #Python
You might like
《猛禽小队》:DC宇宙的又一超级大烂片
2020/04/09 欧美动漫
在WIN98下以apache模块方式安装php
2006/10/09 PHP
php Notice: Undefined index 错误提示解决方法
2010/08/29 PHP
php使用PDO操作MySQL数据库实例
2014/12/30 PHP
PHP超牛逼无限极分类生成树方法
2015/05/11 PHP
WordPress开发中用于获取近期文章的PHP函数使用解析
2016/01/05 PHP
PHP设计模式之工厂模式详解
2017/10/24 PHP
PHP实现一维数组与二维数组去重功能示例
2018/05/24 PHP
Laravel框架实现利用监听器进行sql语句记录功能
2018/06/06 PHP
php实现 master-worker 守护多进程模式的实例代码
2019/07/20 PHP
Extjs4 GridPanel 的几种样式使用介绍
2013/04/18 Javascript
javascript解决innerText浏览器兼容问题思路代码
2013/05/17 Javascript
检查表单元素的值是否为空的实例代码
2016/06/16 Javascript
JS 根据子网掩码,网关计算出所有IP地址范围示例
2020/04/23 Javascript
AngularJS使用拦截器实现的loading功能完整实例
2017/05/17 Javascript
Avalonjs双向数据绑定与监听的实例代码
2017/06/23 Javascript
Vue项目组件化工程开发实践方案
2018/01/09 Javascript
vue-cli webpack模板项目搭建及打包时路径问题的解决方法
2018/02/26 Javascript
JavaScript 截取字符串代码实例
2019/09/05 Javascript
[06:33]DOTA2亚洲邀请赛小组赛第二日 TOP10精彩集锦
2015/01/31 DOTA
[01:02:48]2018DOTA2亚洲邀请赛 4.1 小组赛 A组 LGD vs OG
2018/04/02 DOTA
Python脚本在Appium库上对移动应用实现自动化测试
2015/04/17 Python
Java及python正则表达式详解
2017/12/27 Python
Python网络编程使用select实现socket全双工异步通信功能示例
2018/04/09 Python
利用Python模拟登录pastebin.com的实现方法
2019/07/12 Python
python调用API接口实现登陆短信验证
2020/05/10 Python
Python eval函数原理及用法解析
2020/11/14 Python
Lee牛仔裤澳大利亚官网:美国著名牛仔裤品牌
2017/09/02 全球购物
Supersmart英国:欧洲市场首批食品补充剂供应商之一
2018/05/05 全球购物
洛杉矶时尚女装系列:J.ING US
2019/03/17 全球购物
英国最大的滑板品牌选择:Route One
2019/09/22 全球购物
2014年英语工作总结
2014/12/20 职场文书
大学生毕业个人总结
2015/02/15 职场文书
暂住证证明
2015/06/19 职场文书
环境保护宣传标语大全!
2019/06/28 职场文书
【js设计模式】SOLID五大设计原则
2022/03/24 Javascript