Python headers请求头如何实现快速添加


Posted in Python onNovember 03, 2020

1、为什么要设置headers?

在请求网页爬取的时候,输出的text信息中会出现抱歉,无法访问等字眼,这就是禁止爬取,需要通过反爬机制去解决这个问题。

headers是解决requests请求反爬的方法之一,相当于我们进去这个网页的服务器本身,假装自己本身在爬取数据。

对反爬虫网页,可以设置一些headers信息,模拟成浏览器取访问网站 。

2、 headers在哪里找?

谷歌或者火狐浏览器,在网页面上点击:右键?>检查?>剩余按照图中显示操作,需要按Fn+F5刷新出网页来

有的浏览器是点击:右键->查看元素,刷新

Python爬虫中Requests设置请求头Headers的方法

注意:headers中有很多内容,主要常用的就是user-agent 和 host,他们是以键对的形式展现出来,如果user-agent 以字典键对形式作为headers的内容,就可以反爬成功,就不需要其他键对;否则,需要加入headers下的更多键对形式。

代码如下

import re
# 下方引号内添加替换掉请求头内容
headers_str = """
Accept: application/json, text/javascript, */*; q=0.01
Accept-Encoding: gzip, deflate, br
Accept-Language: zh-CN,zh;q=0.9,en;q=0.8
Cache-Control: no-cache
Connection: keep-alive
Content-Length: 77
Content-Type: application/json
User-Agent: Mozilla/5.0 (iPhone; CPU iPhone OS 13_2_3 like Mac OS X) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/13.0.3 Mobile/15E148 Safari/604.1
X-Apple-App-Id: 632
X-Apple-Frame-Id: daw-10beaddd-c22f-4fd4-8aba-ef4909a721dd
X-Requested-With: XMLHttpRequest
"""
pattern = '^(.*?):(.*)$'
for line in headers_str.splitlines():
  print(re.sub(pattern,'\'\\1\':\'\\2\',',line).replace(' ',''))

结果

Python headers请求头如何实现快速添加

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python for Informatics 第11章之正则表达式(二)
Apr 21 Python
Python实现图片滑动式验证识别方法
Nov 09 Python
对python中执行DOS命令的3种方法总结
May 12 Python
python pygame实现方向键控制小球
May 17 Python
用Python徒手撸一个股票回测框架搭建【推荐】
Aug 05 Python
Python facenet进行人脸识别测试过程解析
Aug 16 Python
python tkinter组件摆放方式详解
Sep 16 Python
Pyqt5自适应布局实例
Dec 13 Python
使用PyOpenGL绘制三维坐标系实例
Dec 24 Python
基于FME使用Python过程图解
May 13 Python
Python logging模块写入中文出现乱码
May 21 Python
python开发实时可视化仪表盘的示例
May 07 Python
python time()的实例用法
Nov 03 #Python
Python-openpyxl表格读取写入的案例详解
Nov 02 #Python
Python常用扩展插件使用教程解析
Nov 02 #Python
python实现三壶谜题的示例详解
Nov 02 #Python
python 实现批量图片识别并翻译
Nov 02 #Python
基于python实现百度语音识别和图灵对话
Nov 02 #Python
用python进行视频剪辑
Nov 02 #Python
You might like
php使用sql数据库 获取字段问题介绍
2013/08/12 PHP
php使用session二维数组实例
2014/11/06 PHP
php实现QQ空间获取当前用户的用户名并生成图片
2015/07/25 PHP
如何把php5.3版本升级到php5.4或者php5.5
2015/07/31 PHP
Laravel 5.1 on SAE环境开发教程【附项目demo源码】
2016/10/09 PHP
Smarty模板常见的简单应用分析
2016/11/15 PHP
PHP笛卡尔积实现原理及代码实例
2020/12/09 PHP
js中有关IE版本检测
2012/01/04 Javascript
关于jQuery判断元素是否存在的问题示例探讨
2014/07/21 Javascript
JQuery拖动表头边框线调整表格列宽效果代码
2014/09/10 Javascript
JavaScript中实现map功能代码分享
2015/06/11 Javascript
基于jquery实现轮播焦点图插件
2016/03/31 Javascript
JavaScript中的原型继承基础学习教程
2016/05/06 Javascript
JavaScript实现星级评分
2017/01/12 Javascript
JavaScript运动框架 多值运动(四)
2017/05/18 Javascript
安装vue-cli报错 -4058 的解决方法
2017/10/19 Javascript
解决jquery有正确返回值但不执行success函数的问题
2018/08/20 jQuery
[03:06]V社市场总监Dota2项目负责人Erik专访:希望更多中国玩家加入DOTA2
2014/07/11 DOTA
[49:08]完美世界DOTA2联赛PWL S2 LBZS vs FTD.C 第一场 11.27
2020/12/01 DOTA
Python中index()和seek()的用法(详解)
2017/04/27 Python
python数据结构之列表和元组的详解
2017/09/23 Python
完美解决安装完tensorflow后pip无法使用的问题
2018/06/11 Python
python调用pyaudio使用麦克风录制wav声音文件的教程
2019/06/26 Python
python多线程+代理池爬取天天基金网、股票数据过程解析
2019/08/13 Python
Python调用系统命令os.system()和os.popen()的实现
2020/12/31 Python
HTML5重塑Web世界它将如何改变互联网
2012/12/17 HTML / CSS
PHP开发的一般流程
2013/08/13 面试题
汽车工程专业应届生求职信
2013/10/19 职场文书
化工专业个人的求职信范文
2013/11/28 职场文书
迟到检讨书1000字
2014/01/15 职场文书
高中历史教学反思
2014/02/08 职场文书
体育比赛口号
2014/06/09 职场文书
机关作风建设自查报告及整改措施
2014/10/21 职场文书
夫妻分居协议书范文
2014/11/26 职场文书
采购部2015年度工作总结
2015/07/24 职场文书
Win11如何默认打开软件界面最大化?Win11默认打开软件界面最大化的方法
2022/07/15 数码科技