Python爬虫:将headers请求头字符串转为字典的方法


Posted in Python onAugust 21, 2019

原生请求头字符串

raw_headers = """Host: open.tool.hexun.com
Pragma: no-cache
Cache-Control: no-cache
User-Agent: Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_2) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.84 Safari/537.36
Accept: */*
Referer: http://stock.hexun.com/gsxw/
Accept-Encoding: gzip, deflate
Accept-Language: zh-CN,zh;q=0.9,en;q=0.8"""

将字符串转为字典

split(sep=None, maxsplit=None)

headers = dict([line.split(": ",1) for line in raw_headers.split("\n")])

输出测试

print(headers)
"""
{
  'Accept-Language': ' zh-CN,zh;q=0.9,en;q=0.8', 
  'Accept-Encoding': ' gzip, deflate', 
  'Accept': ' */*', 
  'User-Agent': ' Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_2) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.84 Safari/537.36', 
  'Host': ' open.tool.hexun.com', 
  'Referer': ' http://stock.hexun.com/gsxw/', 
  'Pragma': ' no-cache', 
  'Cache-Control': ' no-cache'
}

"""

封装为函数

def get_headers(header_raw):
  """
  通过原生请求头获取请求头字典
  :param header_raw: {str} 浏览器请求头
  :return: {dict} headers
  """
  return dict(line.split(": ", 1) for line in header_raw.split("\n"))


def get_cookies(cookie_raw):
  """
  通过原生cookie获取cookie字段
  :param cookie_raw: {str} 浏览器原始cookie
  :return: {dict} cookies
  """
  return dict(line.split("=", 1) for line in cookie_raw.split("; "))

以上这篇Python爬虫:将headers请求头字符串转为字典的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
用Python制作简单的朴素基数估计器的教程
Apr 01 Python
Python简单实现TCP包发送十六进制数据的方法
Apr 16 Python
浅谈django model postgres的json字段编码问题
Jan 05 Python
和孩子一起学习python之变量命名规则
May 27 Python
python删除文本中行数标签的方法
May 31 Python
python得到一个excel的全部sheet标签值方法
Dec 10 Python
python爬虫之快速对js内容进行破解
Jul 09 Python
python实现俄罗斯方块游戏(改进版)
Mar 13 Python
python进行参数传递的方法
May 12 Python
浅谈python处理json和redis hash的坑
Jul 16 Python
python中requests模拟登录的三种方式(携带cookie/session进行请求网站)
Nov 17 Python
Python3中最常用的5种线程锁实例总结
Jul 07 Python
利用python在大量数据文件下删除某一行的例子
Aug 21 #Python
Python 仅获取响应头, 不获取实体的实例
Aug 21 #Python
详解用Python为直方图绘制拟合曲线的两种方法
Aug 21 #Python
Python 使用指定的网卡发送HTTP请求的实例
Aug 21 #Python
Python turtle绘画象棋棋盘
Aug 21 #Python
Python随机函数库random的使用方法详解
Aug 21 #Python
Django+zTree构建组织架构树的方法
Aug 21 #Python
You might like
全国FM电台频率大全 - 13 福建省
2020/03/11 无线电
php学习之 循环结构实现代码
2011/06/09 PHP
PHP中的Streams详细介绍
2014/11/12 PHP
php简单统计字符串单词数量的方法
2015/06/19 PHP
php删除数组中重复元素的方法
2015/12/22 PHP
mysql alter table命令修改表结构实例详解
2016/09/24 PHP
php getcwd与dirname(__FILE__)区别详解
2016/09/24 PHP
Web层改进II-用xmlhttp 无声息提交复杂表单
2007/01/22 Javascript
初探jquery——表单应用范例
2007/02/20 Javascript
javascript 定义新对象方法
2010/02/20 Javascript
网页前台通过js非法字符过滤代码(骂人的话等等)
2010/05/26 Javascript
Javascript(AJAX)解析XML的代码(兼容FIREFOX/IE)
2010/07/11 Javascript
Js基础学习资料
2010/11/23 Javascript
jquery获得同源iframe内body下标签的值的方法
2014/09/25 Javascript
js中this的用法实例分析
2015/01/10 Javascript
使用jquery实现仿百度自动补全特效
2015/07/23 Javascript
基于jQuery实现拖拽图标到回收站并删除功能
2015/11/25 Javascript
整理关于Bootstrap表单的慕课笔记
2017/03/29 Javascript
vue19 组建 Vue.extend component、组件模版、动态组件 的实例代码
2019/04/04 Javascript
Vue自定义指令结合阿里云OSS优化图片的实现方法
2019/11/12 Javascript
[04:12]第二届DOTA2亚洲邀请赛选手传记-Newbee.Sccc
2017/04/03 DOTA
[01:10:49]Secret vs VGJ.S 2018国际邀请赛淘汰赛BO3 第二场 8.24
2018/08/25 DOTA
Python实现的人工神经网络算法示例【基于反向传播算法】
2017/11/11 Python
django模型层(model)进行建表、查询与删除的基础教程
2017/11/21 Python
Python时间戳使用和相互转换详解
2017/12/11 Python
详解Python3.6安装psutil模块和功能简介
2018/05/30 Python
Sanic框架应用部署方法详解
2018/07/18 Python
windows10 pycharm下安装pyltp库和加载模型实现语义角色标注的示例代码
2020/05/07 Python
浏览器实现移动端高性能css3动画(开启gpu加速)
2013/12/23 HTML / CSS
新闻学专业应届生求职信
2013/11/08 职场文书
新领导上任欢迎词
2014/01/13 职场文书
食品质量与安全专业毕业生求职信
2014/08/11 职场文书
2014年留守儿童工作总结
2014/12/10 职场文书
人事主管岗位职责
2015/02/04 职场文书
2015年六一儿童节演讲稿
2015/03/19 职场文书
如何利用Python实现n*n螺旋矩阵
2022/01/18 Python