Python headers请求头如何实现快速添加


Posted in Python onNovember 03, 2020

1、为什么要设置headers?

在请求网页爬取的时候,输出的text信息中会出现抱歉,无法访问等字眼,这就是禁止爬取,需要通过反爬机制去解决这个问题。

headers是解决requests请求反爬的方法之一,相当于我们进去这个网页的服务器本身,假装自己本身在爬取数据。

对反爬虫网页,可以设置一些headers信息,模拟成浏览器取访问网站 。

2、 headers在哪里找?

谷歌或者火狐浏览器,在网页面上点击:右键?>检查?>剩余按照图中显示操作,需要按Fn+F5刷新出网页来

有的浏览器是点击:右键->查看元素,刷新

Python爬虫中Requests设置请求头Headers的方法

注意:headers中有很多内容,主要常用的就是user-agent 和 host,他们是以键对的形式展现出来,如果user-agent 以字典键对形式作为headers的内容,就可以反爬成功,就不需要其他键对;否则,需要加入headers下的更多键对形式。

代码如下

import re
# 下方引号内添加替换掉请求头内容
headers_str = """
Accept: application/json, text/javascript, */*; q=0.01
Accept-Encoding: gzip, deflate, br
Accept-Language: zh-CN,zh;q=0.9,en;q=0.8
Cache-Control: no-cache
Connection: keep-alive
Content-Length: 77
Content-Type: application/json
User-Agent: Mozilla/5.0 (iPhone; CPU iPhone OS 13_2_3 like Mac OS X) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/13.0.3 Mobile/15E148 Safari/604.1
X-Apple-App-Id: 632
X-Apple-Frame-Id: daw-10beaddd-c22f-4fd4-8aba-ef4909a721dd
X-Requested-With: XMLHttpRequest
"""
pattern = '^(.*?):(.*)$'
for line in headers_str.splitlines():
  print(re.sub(pattern,'\'\\1\':\'\\2\',',line).replace(' ',''))

结果

Python headers请求头如何实现快速添加

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
解决DataFrame排序sort的问题
Jun 07 Python
python3.6.3安装图文教程 TensorFlow安装配置方法
Jun 24 Python
django配置连接数据库及原生sql语句的使用方法
Mar 03 Python
对DJango视图(views)和模版(templates)的使用详解
Jul 17 Python
python脚本实现音频m4a格式转成MP3格式的实例代码
Oct 09 Python
wxPython实现整点报时
Nov 18 Python
python实现二分类的卡方分箱示例
Nov 22 Python
Pytorch技巧:DataLoader的collate_fn参数使用详解
Jan 08 Python
通过实例解析Python return运行原理
Mar 04 Python
python3通过qq邮箱发送邮件以及附件
May 20 Python
python可以用哪些数据库
Jun 22 Python
Python基础之字符串格式化详解
Apr 21 Python
python time()的实例用法
Nov 03 #Python
Python-openpyxl表格读取写入的案例详解
Nov 02 #Python
Python常用扩展插件使用教程解析
Nov 02 #Python
python实现三壶谜题的示例详解
Nov 02 #Python
python 实现批量图片识别并翻译
Nov 02 #Python
基于python实现百度语音识别和图灵对话
Nov 02 #Python
用python进行视频剪辑
Nov 02 #Python
You might like
关于PHP自动判断字符集并转码的详解
2013/06/26 PHP
PHP实现图片不变型裁剪及图片按比例裁剪的方法
2016/01/14 PHP
jQuery动画animate方法使用介绍
2013/05/06 Javascript
JavaScript中几个重要的属性(this、constructor、prototype)介绍
2013/05/19 Javascript
js特效,页面下雪的小例子
2013/06/17 Javascript
javascript 终止函数执行操作
2014/02/14 Javascript
jQuery实现鼠标滑过Div层背景变颜色的方法
2015/02/17 Javascript
JavaScript的Number对象的toString()方法
2015/12/18 Javascript
JavaScript面向对象编写购物车功能
2016/08/19 Javascript
js css自定义分页效果
2017/02/24 Javascript
vue实现中部导航栏布局功能
2019/07/30 Javascript
vue 解决异步数据更新问题
2019/10/29 Javascript
Python实现partial改变方法默认参数
2014/08/18 Python
用Python将IP地址在整型和字符串之间轻松转换
2017/03/22 Python
基于Python3 逗号代码 和 字符图网格(详谈)
2017/06/22 Python
理解python中生成器用法
2017/12/20 Python
python 按照固定长度分割字符串的方法小结
2018/04/30 Python
利用Python的turtle库绘制玫瑰教程
2019/11/23 Python
Python venv虚拟环境配置过程解析
2020/07/08 Python
爬虫代理的cookie如何生成运行
2020/09/22 Python
解析html5 canvas实现背景鼠标连线动态效果代码
2019/06/17 HTML / CSS
斯凯奇美国官网:SKECHERS美国
2016/08/20 全球购物
英国和世界各地预订便宜的酒店:LateRooms.com
2019/05/05 全球购物
澳大利亚儿童鞋在线:The Trybe
2019/07/16 全球购物
精致的手工皮鞋:Shoe Embassy
2019/11/08 全球购物
机械专业个人求职自荐信格式
2013/09/21 职场文书
季度思想汇报
2014/01/01 职场文书
黄继光的英雄事迹材料
2014/02/13 职场文书
股东合作协议书范本
2014/04/14 职场文书
《美丽的南沙群岛》教学反思
2014/04/27 职场文书
五四演讲稿范文
2014/09/03 职场文书
中学生社区服务活动报告
2015/02/05 职场文书
2016会计专业自荐信范文
2016/01/28 职场文书
大学生暑期社会实践的个人总结!
2019/07/17 职场文书
pandas 操作 Excel操作总结
2021/03/31 Python
Mysql将字符串按照指定字符分割的正确方法
2022/05/30 MySQL