Python爬虫:将headers请求头字符串转为字典的方法


Posted in Python onAugust 21, 2019

原生请求头字符串

raw_headers = """Host: open.tool.hexun.com
Pragma: no-cache
Cache-Control: no-cache
User-Agent: Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_2) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.84 Safari/537.36
Accept: */*
Referer: http://stock.hexun.com/gsxw/
Accept-Encoding: gzip, deflate
Accept-Language: zh-CN,zh;q=0.9,en;q=0.8"""

将字符串转为字典

split(sep=None, maxsplit=None)

headers = dict([line.split(": ",1) for line in raw_headers.split("\n")])

输出测试

print(headers)
"""
{
  'Accept-Language': ' zh-CN,zh;q=0.9,en;q=0.8', 
  'Accept-Encoding': ' gzip, deflate', 
  'Accept': ' */*', 
  'User-Agent': ' Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_2) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.84 Safari/537.36', 
  'Host': ' open.tool.hexun.com', 
  'Referer': ' http://stock.hexun.com/gsxw/', 
  'Pragma': ' no-cache', 
  'Cache-Control': ' no-cache'
}

"""

封装为函数

def get_headers(header_raw):
  """
  通过原生请求头获取请求头字典
  :param header_raw: {str} 浏览器请求头
  :return: {dict} headers
  """
  return dict(line.split(": ", 1) for line in header_raw.split("\n"))


def get_cookies(cookie_raw):
  """
  通过原生cookie获取cookie字段
  :param cookie_raw: {str} 浏览器原始cookie
  :return: {dict} cookies
  """
  return dict(line.split("=", 1) for line in cookie_raw.split("; "))

以上这篇Python爬虫:将headers请求头字符串转为字典的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python isinstance判断对象类型
Sep 06 Python
详解python开发环境搭建
Dec 16 Python
浅谈Python的垃圾回收机制
Dec 17 Python
[原创]Python入门教程2. 字符串基本操作【运算、格式化输出、常用函数】
Oct 29 Python
selenium获取当前页面的url、源码、title的方法
Jun 12 Python
PyQt5根据控件Id获取控件对象的方法
Jun 25 Python
django数据库自动重连的方法实例
Jul 21 Python
face++与python实现人脸识别签到(考勤)功能
Aug 28 Python
Python 实现日志同时输出到屏幕和文件
Feb 19 Python
解决python cv2.imread 读取中文路径的图片返回为None的问题
Jun 02 Python
解决pyinstaller打包运行程序时出现缺少plotly库问题
Jun 02 Python
PyCharm上安装Package的实现(以pandas为例)
Sep 18 Python
利用python在大量数据文件下删除某一行的例子
Aug 21 #Python
Python 仅获取响应头, 不获取实体的实例
Aug 21 #Python
详解用Python为直方图绘制拟合曲线的两种方法
Aug 21 #Python
Python 使用指定的网卡发送HTTP请求的实例
Aug 21 #Python
Python turtle绘画象棋棋盘
Aug 21 #Python
Python随机函数库random的使用方法详解
Aug 21 #Python
Django+zTree构建组织架构树的方法
Aug 21 #Python
You might like
php另类上传图片的方法(PHP用Socket上传图片)
2013/10/30 PHP
phpmyadmin提示The mbstring extension is missing的解决方法
2014/12/17 PHP
phpcms的分类名称和类别名称的调用
2017/01/05 PHP
微信公众号开发之获取位置信息php代码
2018/06/13 PHP
超强的IE背景图片闪烁(抖动)的解决办法
2007/09/09 Javascript
javascript与webservice的通信实现代码
2010/12/25 Javascript
关于JavaScript中string 的replace
2013/04/12 Javascript
JS打开新窗口的2种方式
2013/04/18 Javascript
js页面跳转的问题(跳转到父页面、最外层页面、本页面)
2013/08/14 Javascript
freemarker判断对象是否为空的方法
2015/08/13 Javascript
js密码强度检测
2016/01/07 Javascript
微信公众号开发 实现点击返回按钮就返回到聊天界面
2016/12/15 Javascript
浅谈Angular 中何时取消订阅
2017/11/22 Javascript
深入理解vue中slot与slot-scope的具体使用
2018/01/26 Javascript
微信小程序中使用ECharts 异步加载数据的方法
2018/06/27 Javascript
Angular中的ng-template及angular 使用ngTemplateOutlet 指令的方法
2018/08/08 Javascript
antd-DatePicker组件获取时间值,及相关设置方式
2020/10/27 Javascript
使用Python进行新浪微博的mid和url互相转换实例(10进制和62进制互算)
2014/04/25 Python
详解Python中的条件判断语句
2015/05/14 Python
Python字典简介以及用法详解
2016/11/15 Python
python实现人脸识别代码
2017/11/08 Python
在双python下设置python3为默认的方法
2018/10/31 Python
python django生成迁移文件的实例
2019/08/31 Python
python给指定csv表格中的联系人群发邮件(带附件的邮件)
2019/12/31 Python
python3用PyPDF2解析pdf文件,用正则匹配数据方式
2020/05/12 Python
pytorch VGG11识别cifar10数据集(训练+预测单张输入图片操作)
2020/06/24 Python
总结python 三种常见的内存泄漏场景
2020/11/20 Python
scrapy-splash简单使用详解
2021/02/21 Python
领导视察欢迎词
2014/01/15 职场文书
新闻发布会主持词
2014/03/28 职场文书
《桥》教学反思
2014/04/09 职场文书
竞选部长演讲稿
2014/04/26 职场文书
工厂搬迁方案
2014/05/11 职场文书
Mysql官方性能测试工具mysqlslap的使用简介
2021/05/21 MySQL
Mysql数据库索引面试题(程序员基础技能)
2021/05/31 MySQL
解决SpringBoot文件上传临时目录找不到的问题
2021/07/01 Java/Android