Python中Selenium对Cookie的操作方法


Posted in Python onJuly 09, 2021

1、Cookie介绍

HTTP协议是无状态的协议。一旦数据交换完毕,客户端与服务器端的连接就会关闭,再次交换数据需要建立新的连接,这就意味着服务器无法从连接上跟踪会话。也就是说即使第一次和服务器连接后并且登录成功后,第二次请求服务器依然不能知道当前请求是哪个用户。举个例子:用户A购买了一件商品放入购物车内,当再次购买商品时,服务器已经无法判断该购买行为是属于用户A的会话,还是用户B的会话了。要跟踪该会话,必须引入一种机制。

什么是一次会话:

用户打开浏览器访问某个网站, 在这个网站上浏览任意页面, 访问完成后将浏览器关闭的过程称为是一次会话。

  • Cookie的出现就是为了解决这个问题,第一次登录后服务器后,如果服务器需要记录该用户状态,就使用Response向客户端浏览器颁发一个Cookie,浏览器会把Cookie数据保存在本地。该用户发送第二次请求的时候,就会自动的把上次请求存储的Cookie数据自动的携带给服务器,服务器检查该Cookie存储namevalue等信息,以此来辨认用户状态,服务器还可以根据需要修改Cookie的内容。
  • Cookie就相当于是服务器给客户端们颁发一个通行证,每人一个,无论谁访问都必须携带自己通行证。这样服务器就能从通行证上确认客户身份,这就是Cookie的工作原理。
  • Cookie存储的数据量有限,不同的浏览器有不同的存储大小,但一般不超过4KB,因此使用Cookie只能存储一些小量的数据。
  • Cookie的出现弥补HTTP协议无状态的不足。但是Cookie是存储在客户端的,通过浏览器或者抓包工具很容易就能获取到,所以非常不安全。

2、Session介绍

  • Session是另一种记录客户状态的机制,不同的是Cookie保存在客户端浏览器中,而Session保存在服务器上。客户端浏览器访问服务器的时候,服务器把客户端信息以某种形式记录在服务器上。存储在服务器的数据会更加的安全,不容易被窃取。客户端浏览器再次访问时,只需要从该Session中查找该客户的状态就可以了。
  • 如果说Cookie机制是通过检查客户身上的“通行证”来确定客户身份的话,那么Session机制就是通过检查服务器上的“客户明细表”来确认客户身份。Session相当于程序在服务器上建立的一份客户档案,客户来访的时候只需要查询客户档案表就可以了。
  • Session存储在服务器也有一定的弊端,就是会占用服务器的资源,但现在服务器已经发展至今,存储一些Session信息还是绰绰有余的。

3、Cookie工作原理图解

如下图所示:

Python中Selenium对Cookie的操作方法

提示:如果步骤5携带的是过期的cookie或者是错误的cookie,那么将认证失败,返回至要求身份认证页面。

记录Cookie的作用:

  1. 用户第一次登陆时,勾选下次直接登陆或者记住密码,就是采用记录Cookie实现的。
  2. Cookie内记录用户名和密码(加密)信息,只要请求时服务器收到Cookie,识别成功,默认为已登陆。

4、Cookie内容参数说明

 

参数 描述
name 必需。规定 Cookie的名称。
value 必需。规定 Cookie的值。
expire 可选。规定 Cookie的有效期。
domain 可选。规定 Cookie的域名。
path 可选。规定 Cookie的服务器路径。
secure 可选。规定是否通过安全的 HTTPS 连接来传输 Cookie。
httpOnly 可选。防止XSS攻击(跨站脚本攻击)

说明:

  • pathCookie的有效范围,这个参数是在domain参数基础上的有效范围,如果path设置为”/”,那就是在整个domain都有效。
  • secureCookie是否仅通过安全的https,值为0或1。如果值为1,则Cookie只能在https连接上有效,默认值为0,表示Cookiehttphttps连接上都有效。(0或1,也可表示Flase或True)
  • httpOnly:通过js脚本将无法读取到Cookie信息,这样能有效的防止XSS攻击(跨站脚本攻击),这样就增加了Cookie的安全性,即便是这样,也不要将重要信息存入Cookie

5、Selenium操作Cookie的API

webdriver可以读取、添加和删除Cookie信息。

webdriver操作Cookie的方法有:

 

操作 说明
get_cookies() 获得所有Cookie信息(重点)
add_cookie(cookie_dict) 添加Cookie,必须有name 和value 值(重点)
get_cookie(name值) 返回指定name名称的Cookie信息
delete_cookie(name) 删除特定(部分)的Cookie信息
delete_all_cookies() 删除所有Cookie信息

6、Selenium操作Cookie的示例

"""
1.学习目标:
    掌握selenium对cookie操作
2.语法
    2.1获取所有cookie
        driver.get.cookies()
        返同列表格式字典类型 [{},{},{}]
    2.2添加cookie
        driver.add_cookie(参数)
        参数:字典格式{"name":"name值","value":"value值"}
3.需求
    实现selenium对cookie操作
"""
# 1.导入selenium
from selenium import webdriver
from time import sleep

# 2.打开浏览器
driver = webdriver.Chrome()

# 3.打开注册A页面
# 不打开一个页面,cookie为[]。
url = "http://www.baidu.com/"
driver.get(url)

# 4.操作cookie
# 4.1 获取cookie
cookies = driver.get_cookies()
for cookie in cookies:
    # 值打印cookie中的name和value
    print("%s -> %s" % (cookie['name'], cookie['value']))

print("=======================")
# 4.2 获取一个cookie的指定属性值
# 参数是一个cookie中name的属性值
# 没有找到返回None
print(driver.get_cookie("BAIDUID"))

print("=======================")
# 4.3 添加cookie
cookie = {"name": "key-aaaaaaa", "value": "value-aaaaaaa"}
driver.add_cookie(cookie)

# 添加后再次获取
cookies = driver.get_cookies()
for cookie in cookies:
    print("%s -> %s" % (cookie['name'], cookie['value']))

print("=======================")
# 4.4 删除指定cookie
# 根据name删除
driver.delete_cookie("key-aaaaaaa")
# 删除后再次获取
cookies = driver.get_cookies()
for cookie in cookies:
    print("%s -> %s" % (cookie['name'], cookie['value']))

print("=======================")
# 4.5 删除全部cookie
driver.delete_all_cookies()
print(driver.get_cookies())

# 5.关闭浏览器
sleep(2)
driver.quit()

参考:https://www.cnblogs.com/linguoguo/p/5106618.html

到此这篇关于Selenium对Cookie的操作 的文章就介绍到这了,更多相关Selenium Cookie操作 内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
Python的Django框架中settings文件的部署建议
May 30 Python
简单讲解Python中的数字类型及基本的数学计算
Mar 11 Python
利用python生成一个导出数据库的bat脚本文件的方法
Dec 30 Python
python中numpy基础学习及进行数组和矢量计算
Feb 12 Python
使用python实现tcp自动重连
Jul 02 Python
Python反爬虫技术之防止IP地址被封杀的讲解
Jan 09 Python
基于腾讯云服务器部署微信小程序后台服务(Python+Django)
May 08 Python
python修改微信和支付宝步数的示例代码
Oct 12 Python
python生成word合同的实例方法
Jan 12 Python
Python获取百度热搜的完整代码
Apr 07 Python
python缺失值的解决方法总结
Jun 09 Python
Python 中 Shutil 模块详情
Nov 11 Python
Python常用配置文件ini、json、yaml读写总结
图文详解matlab原始处理图像几何变换
Django中session进行权限管理的使用
python利用pandas分析学生期末成绩实例代码
使用pandas生成/读取csv文件的方法实例
python自动化八大定位元素讲解
python实现简单聊天功能
You might like
用libTemplate实现静态网页的生成
2006/10/09 PHP
让PHP支持断点续传的源码
2010/05/16 PHP
PHP 作用域解析运算符(::)
2010/07/27 PHP
PHP实现的封装验证码类详解
2013/06/18 PHP
ThinkPHP3.1新特性之G方法的使用
2014/06/19 PHP
php curl简单采集图片生成base64编码(并附curl函数参数说明)
2019/02/15 PHP
jQuery html()等方法介绍
2009/11/18 Javascript
关于jquery性能最佳实践的讨论,与求教
2012/03/30 Javascript
js字符串完全替换函数分享
2014/12/03 Javascript
了不起的node.js读书笔记之node.js中的特性
2014/12/22 Javascript
Javascript中的数据类型之旅
2015/10/18 Javascript
基于jQuery实现点击最后一行实现行自增效果的表格
2016/01/12 Javascript
ES6中如何使用Set和WeakSet
2016/03/10 Javascript
快速掌握Node.js事件驱动模型
2016/03/21 Javascript
Angularjs实现搜索关键字高亮显示效果
2017/01/17 Javascript
Vue动态实现评分效果
2017/05/24 Javascript
AngularJS ionic手势事件的使用总结
2017/08/09 Javascript
vue2.0 移动端实现下拉刷新和上拉加载更多的示例
2018/04/23 Javascript
浅谈node中的cluster集群
2018/06/02 Javascript
JS解惑之Object中的key是有序的么
2019/05/06 Javascript
JS实现的检验身份证格式并输出出生日期,年龄,性别,出生地示例
2019/05/17 Javascript
解决Idea、WebStorm下使用Vue cli脚手架项目无法使用Webpack别名的问题
2019/10/11 Javascript
详解小程序如何改变onLoad的执行时机
2019/11/01 Javascript
通过js实现压缩图片上传功能
2020/02/25 Javascript
[05:09]DOTA2-DPC中国联赛2月22日Recap集锦
2021/03/11 DOTA
Python中使用OpenCV库来进行简单的气象学遥感影像计算
2016/02/19 Python
Python网络爬虫实例讲解
2016/04/28 Python
python实现对象列表根据某个属性排序的方法详解
2019/06/11 Python
django和vue实现数据交互的方法
2019/08/21 Python
如何用Matlab和Python读取Netcdf文件
2021/02/19 Python
推荐10个CSS3 制作的创意下拉菜单效果
2014/02/11 HTML / CSS
安全责任书范本
2014/04/15 职场文书
小区的门卫岗位职责
2014/10/01 职场文书
2014年驾驶员工作总结
2014/11/18 职场文书
Redis集群的关闭与重启操作
2021/07/07 Redis
Win11安装受阻怎么办? Windows11安装问题与解决方案汇总
2021/11/21 数码科技