Python headers请求头如何实现快速添加


Posted in Python onNovember 03, 2020

1、为什么要设置headers?

在请求网页爬取的时候,输出的text信息中会出现抱歉,无法访问等字眼,这就是禁止爬取,需要通过反爬机制去解决这个问题。

headers是解决requests请求反爬的方法之一,相当于我们进去这个网页的服务器本身,假装自己本身在爬取数据。

对反爬虫网页,可以设置一些headers信息,模拟成浏览器取访问网站 。

2、 headers在哪里找?

谷歌或者火狐浏览器,在网页面上点击:右键?>检查?>剩余按照图中显示操作,需要按Fn+F5刷新出网页来

有的浏览器是点击:右键->查看元素,刷新

Python爬虫中Requests设置请求头Headers的方法

注意:headers中有很多内容,主要常用的就是user-agent 和 host,他们是以键对的形式展现出来,如果user-agent 以字典键对形式作为headers的内容,就可以反爬成功,就不需要其他键对;否则,需要加入headers下的更多键对形式。

代码如下

import re
# 下方引号内添加替换掉请求头内容
headers_str = """
Accept: application/json, text/javascript, */*; q=0.01
Accept-Encoding: gzip, deflate, br
Accept-Language: zh-CN,zh;q=0.9,en;q=0.8
Cache-Control: no-cache
Connection: keep-alive
Content-Length: 77
Content-Type: application/json
User-Agent: Mozilla/5.0 (iPhone; CPU iPhone OS 13_2_3 like Mac OS X) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/13.0.3 Mobile/15E148 Safari/604.1
X-Apple-App-Id: 632
X-Apple-Frame-Id: daw-10beaddd-c22f-4fd4-8aba-ef4909a721dd
X-Requested-With: XMLHttpRequest
"""
pattern = '^(.*?):(.*)$'
for line in headers_str.splitlines():
  print(re.sub(pattern,'\'\\1\':\'\\2\',',line).replace(' ',''))

结果

Python headers请求头如何实现快速添加

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
详解Python中的__init__和__new__
Mar 12 Python
python中__call__方法示例分析
Oct 11 Python
详解Python中的条件判断语句
May 14 Python
Python循环语句中else的用法总结
Sep 11 Python
Django框架搭建的简易图书信息网站案例
May 25 Python
Python自动抢红包教程详解
Jun 11 Python
Python爬虫抓取技术的一些经验
Jul 12 Python
将python文件打包exe独立运行程序方法详解
Feb 12 Python
Python实现Wordcloud生成词云图的示例
Mar 30 Python
Python3爬虫中Ajax的用法
Jul 10 Python
Python如何操作docker redis过程解析
Aug 10 Python
python openCV自制绘画板
Oct 27 Python
python time()的实例用法
Nov 03 #Python
Python-openpyxl表格读取写入的案例详解
Nov 02 #Python
Python常用扩展插件使用教程解析
Nov 02 #Python
python实现三壶谜题的示例详解
Nov 02 #Python
python 实现批量图片识别并翻译
Nov 02 #Python
基于python实现百度语音识别和图灵对话
Nov 02 #Python
用python进行视频剪辑
Nov 02 #Python
You might like
php中将数组转成字符串并保存到数据库中的函数代码
2013/09/29 PHP
php技巧小结【推荐】
2017/01/19 PHP
ThinkPHP删除栏目(实现批量删除栏目)
2017/06/21 PHP
Javascript实例教程(19) 使用HoTMetal(7)
2006/12/23 Javascript
JS面向对象编程之对象使用分析
2010/08/19 Javascript
学习面向对象之面向对象的术语
2010/11/30 Javascript
jquery重复提交请求的原因浅析
2014/05/23 Javascript
jquery小火箭返回顶部代码分享
2015/08/19 Javascript
AngularJS中$watch和$timeout的使用示例
2016/09/20 Javascript
JSON字符串和JSON对象相互转化实例详解
2017/01/05 Javascript
bootstrap table 表格中增加下拉菜单末行出现滚动条的快速解决方法
2017/01/05 Javascript
NodeJS 实现手机短信验证模块阿里大于功能
2017/06/19 NodeJs
详解基于DllPlugin和DllReferencePlugin的webpack构建优化
2018/06/28 Javascript
vue 自定义提示框(Toast)组件的实现代码
2018/08/17 Javascript
JSONP原理及应用实例详解
2018/09/13 Javascript
Angular Excel 导入与导出的实现代码
2019/04/17 Javascript
Nuxt的路由动画效果案例
2020/11/06 Javascript
python高并发异步服务器核心库forkcore使用方法
2013/11/26 Python
python使用calendar输出指定年份全年日历的方法
2015/04/04 Python
Python3.4实现从HTTP代理网站批量获取代理并筛选的方法示例
2017/09/26 Python
Python WSGI的深入理解
2018/08/01 Python
pandas分别写入excel的不同sheet方法
2018/12/11 Python
Django框架搭建的简易图书信息网站案例
2019/05/25 Python
python ftplib模块使用代码实例
2019/12/31 Python
python3格式化字符串 f-string的高级用法(推荐)
2020/03/04 Python
在Django中预防CSRF攻击的操作
2020/03/13 Python
基于jupyter代码无法在pycharm中运行的解决方法
2020/04/21 Python
Pycharm中安装wordcloud等库失败问题及终端通过pip安装的Python库如何添加到Pycharm解释器中(推荐)
2020/05/10 Python
Python实现进度条和时间预估的示例代码
2020/06/02 Python
HTML5重塑Web世界它将如何改变互联网
2012/12/17 HTML / CSS
Html5实现如何在两个div元素之间拖放图像
2013/03/29 HTML / CSS
美国新蛋IT数码商城:Newegg.com
2016/07/21 全球购物
红旗团支部事迹材料
2014/01/27 职场文书
班组长竞聘书
2014/03/31 职场文书
节能环保标语
2014/06/12 职场文书
Html5新增了哪些功能
2021/04/16 HTML / CSS