Python headers请求头如何实现快速添加


Posted in Python onNovember 03, 2020

1、为什么要设置headers?

在请求网页爬取的时候,输出的text信息中会出现抱歉,无法访问等字眼,这就是禁止爬取,需要通过反爬机制去解决这个问题。

headers是解决requests请求反爬的方法之一,相当于我们进去这个网页的服务器本身,假装自己本身在爬取数据。

对反爬虫网页,可以设置一些headers信息,模拟成浏览器取访问网站 。

2、 headers在哪里找?

谷歌或者火狐浏览器,在网页面上点击:右键?>检查?>剩余按照图中显示操作,需要按Fn+F5刷新出网页来

有的浏览器是点击:右键->查看元素,刷新

Python爬虫中Requests设置请求头Headers的方法

注意:headers中有很多内容,主要常用的就是user-agent 和 host,他们是以键对的形式展现出来,如果user-agent 以字典键对形式作为headers的内容,就可以反爬成功,就不需要其他键对;否则,需要加入headers下的更多键对形式。

代码如下

import re
# 下方引号内添加替换掉请求头内容
headers_str = """
Accept: application/json, text/javascript, */*; q=0.01
Accept-Encoding: gzip, deflate, br
Accept-Language: zh-CN,zh;q=0.9,en;q=0.8
Cache-Control: no-cache
Connection: keep-alive
Content-Length: 77
Content-Type: application/json
User-Agent: Mozilla/5.0 (iPhone; CPU iPhone OS 13_2_3 like Mac OS X) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/13.0.3 Mobile/15E148 Safari/604.1
X-Apple-App-Id: 632
X-Apple-Frame-Id: daw-10beaddd-c22f-4fd4-8aba-ef4909a721dd
X-Requested-With: XMLHttpRequest
"""
pattern = '^(.*?):(.*)$'
for line in headers_str.splitlines():
  print(re.sub(pattern,'\'\\1\':\'\\2\',',line).replace(' ',''))

结果

Python headers请求头如何实现快速添加

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python MD5文件生成码
Jan 12 Python
python操作MySQL数据库的方法分享
May 29 Python
天翼开放平台免费短信验证码接口使用实例
Dec 18 Python
Python SQLite3数据库操作类分享
Jun 10 Python
使用Python的PEAK来适配协议的教程
Apr 14 Python
python爬虫 正则表达式使用技巧及爬取个人博客的实例讲解
Oct 20 Python
python flask解析json数据不完整的解决方法
May 26 Python
python正则-re的用法详解
Jul 28 Python
使用Python调取任意数字资产钱包余额功能
Aug 15 Python
Django如何实现上传图片功能
Aug 16 Python
python base64库给用户名或密码加密的流程
Jan 02 Python
Python如何对齐字符串
Jul 30 Python
python time()的实例用法
Nov 03 #Python
Python-openpyxl表格读取写入的案例详解
Nov 02 #Python
Python常用扩展插件使用教程解析
Nov 02 #Python
python实现三壶谜题的示例详解
Nov 02 #Python
python 实现批量图片识别并翻译
Nov 02 #Python
基于python实现百度语音识别和图灵对话
Nov 02 #Python
用python进行视频剪辑
Nov 02 #Python
You might like
php split汉字
2009/06/05 PHP
《PHP编程最快明白》第八讲:php启发和小结
2010/11/01 PHP
PHP简单实现“相关文章推荐”功能的方法
2014/07/19 PHP
JS无限树状列表实现代码
2011/01/11 Javascript
基于Jquery的文字自动截取(提供源代码)
2011/08/09 Javascript
javascript全局变量封装模块实现代码
2012/11/28 Javascript
面向对象继承实例(a如何继承b问题)(自写)
2013/07/01 Javascript
鼠标经过显示二级菜单js特效
2013/08/13 Javascript
全面解析Bootstrap中transition、affix的使用方法
2016/05/30 Javascript
在Javascript操作JSON对象,增加 删除 修改的简单实现
2016/06/02 Javascript
JS中innerHTML和pasteHTML的区别实例分析
2016/06/22 Javascript
原生js仿淘宝网商品放大镜效果
2017/02/28 Javascript
js中DOM三级列表(代码分享)
2017/03/20 Javascript
微信小程序联网请求的轮播图
2017/07/07 Javascript
快速处理vue渲染前的显示问题
2018/03/05 Javascript
vue 权限认证token的实现方法
2018/07/17 Javascript
vue请求本地自己编写的json文件的方法
2019/04/25 Javascript
Vue v-text指令简单使用方法示例
2019/09/19 Javascript
[02:51]2018年度DOTA2最佳中单位选手-完美盛典
2018/12/17 DOTA
python实现的简单猜数字游戏
2015/04/04 Python
python 排序算法总结及实例详解
2016/09/28 Python
Python实现的栈、队列、文件目录遍历操作示例
2019/05/06 Python
Python同时迭代多个序列的方法
2020/07/28 Python
Python创建临时文件和文件夹
2020/08/05 Python
解决python3.x安装numpy成功但import出错的问题
2020/11/17 Python
美国购买汽车零件网站:Buy Auto Parts
2018/04/02 全球购物
年度考核评语
2014/01/19 职场文书
模范教师事迹材料
2014/02/10 职场文书
置业顾问岗位职责
2014/03/02 职场文书
教师考核材料
2014/05/21 职场文书
毕业生求职信
2014/06/10 职场文书
工厂仓管员岗位职责范本
2014/07/17 职场文书
法人身份证明书
2014/10/08 职场文书
党风廉政建设心得体会
2019/05/21 职场文书
祝福语集锦:给妹妹结婚的祝福语
2019/12/18 职场文书
go 实现简易端口扫描的示例
2021/05/22 Golang