Python中Selenium对Cookie的操作方法


Posted in Python onJuly 09, 2021

1、Cookie介绍

HTTP协议是无状态的协议。一旦数据交换完毕,客户端与服务器端的连接就会关闭,再次交换数据需要建立新的连接,这就意味着服务器无法从连接上跟踪会话。也就是说即使第一次和服务器连接后并且登录成功后,第二次请求服务器依然不能知道当前请求是哪个用户。举个例子:用户A购买了一件商品放入购物车内,当再次购买商品时,服务器已经无法判断该购买行为是属于用户A的会话,还是用户B的会话了。要跟踪该会话,必须引入一种机制。

什么是一次会话:

用户打开浏览器访问某个网站, 在这个网站上浏览任意页面, 访问完成后将浏览器关闭的过程称为是一次会话。

  • Cookie的出现就是为了解决这个问题,第一次登录后服务器后,如果服务器需要记录该用户状态,就使用Response向客户端浏览器颁发一个Cookie,浏览器会把Cookie数据保存在本地。该用户发送第二次请求的时候,就会自动的把上次请求存储的Cookie数据自动的携带给服务器,服务器检查该Cookie存储namevalue等信息,以此来辨认用户状态,服务器还可以根据需要修改Cookie的内容。
  • Cookie就相当于是服务器给客户端们颁发一个通行证,每人一个,无论谁访问都必须携带自己通行证。这样服务器就能从通行证上确认客户身份,这就是Cookie的工作原理。
  • Cookie存储的数据量有限,不同的浏览器有不同的存储大小,但一般不超过4KB,因此使用Cookie只能存储一些小量的数据。
  • Cookie的出现弥补HTTP协议无状态的不足。但是Cookie是存储在客户端的,通过浏览器或者抓包工具很容易就能获取到,所以非常不安全。

2、Session介绍

  • Session是另一种记录客户状态的机制,不同的是Cookie保存在客户端浏览器中,而Session保存在服务器上。客户端浏览器访问服务器的时候,服务器把客户端信息以某种形式记录在服务器上。存储在服务器的数据会更加的安全,不容易被窃取。客户端浏览器再次访问时,只需要从该Session中查找该客户的状态就可以了。
  • 如果说Cookie机制是通过检查客户身上的“通行证”来确定客户身份的话,那么Session机制就是通过检查服务器上的“客户明细表”来确认客户身份。Session相当于程序在服务器上建立的一份客户档案,客户来访的时候只需要查询客户档案表就可以了。
  • Session存储在服务器也有一定的弊端,就是会占用服务器的资源,但现在服务器已经发展至今,存储一些Session信息还是绰绰有余的。

3、Cookie工作原理图解

如下图所示:

Python中Selenium对Cookie的操作方法

提示:如果步骤5携带的是过期的cookie或者是错误的cookie,那么将认证失败,返回至要求身份认证页面。

记录Cookie的作用:

  1. 用户第一次登陆时,勾选下次直接登陆或者记住密码,就是采用记录Cookie实现的。
  2. Cookie内记录用户名和密码(加密)信息,只要请求时服务器收到Cookie,识别成功,默认为已登陆。

4、Cookie内容参数说明

 

参数 描述
name 必需。规定 Cookie的名称。
value 必需。规定 Cookie的值。
expire 可选。规定 Cookie的有效期。
domain 可选。规定 Cookie的域名。
path 可选。规定 Cookie的服务器路径。
secure 可选。规定是否通过安全的 HTTPS 连接来传输 Cookie。
httpOnly 可选。防止XSS攻击(跨站脚本攻击)

说明:

  • pathCookie的有效范围,这个参数是在domain参数基础上的有效范围,如果path设置为”/”,那就是在整个domain都有效。
  • secureCookie是否仅通过安全的https,值为0或1。如果值为1,则Cookie只能在https连接上有效,默认值为0,表示Cookiehttphttps连接上都有效。(0或1,也可表示Flase或True)
  • httpOnly:通过js脚本将无法读取到Cookie信息,这样能有效的防止XSS攻击(跨站脚本攻击),这样就增加了Cookie的安全性,即便是这样,也不要将重要信息存入Cookie

5、Selenium操作Cookie的API

webdriver可以读取、添加和删除Cookie信息。

webdriver操作Cookie的方法有:

 

操作 说明
get_cookies() 获得所有Cookie信息(重点)
add_cookie(cookie_dict) 添加Cookie,必须有name 和value 值(重点)
get_cookie(name值) 返回指定name名称的Cookie信息
delete_cookie(name) 删除特定(部分)的Cookie信息
delete_all_cookies() 删除所有Cookie信息

6、Selenium操作Cookie的示例

"""
1.学习目标:
    掌握selenium对cookie操作
2.语法
    2.1获取所有cookie
        driver.get.cookies()
        返同列表格式字典类型 [{},{},{}]
    2.2添加cookie
        driver.add_cookie(参数)
        参数:字典格式{"name":"name值","value":"value值"}
3.需求
    实现selenium对cookie操作
"""
# 1.导入selenium
from selenium import webdriver
from time import sleep

# 2.打开浏览器
driver = webdriver.Chrome()

# 3.打开注册A页面
# 不打开一个页面,cookie为[]。
url = "http://www.baidu.com/"
driver.get(url)

# 4.操作cookie
# 4.1 获取cookie
cookies = driver.get_cookies()
for cookie in cookies:
    # 值打印cookie中的name和value
    print("%s -> %s" % (cookie['name'], cookie['value']))

print("=======================")
# 4.2 获取一个cookie的指定属性值
# 参数是一个cookie中name的属性值
# 没有找到返回None
print(driver.get_cookie("BAIDUID"))

print("=======================")
# 4.3 添加cookie
cookie = {"name": "key-aaaaaaa", "value": "value-aaaaaaa"}
driver.add_cookie(cookie)

# 添加后再次获取
cookies = driver.get_cookies()
for cookie in cookies:
    print("%s -> %s" % (cookie['name'], cookie['value']))

print("=======================")
# 4.4 删除指定cookie
# 根据name删除
driver.delete_cookie("key-aaaaaaa")
# 删除后再次获取
cookies = driver.get_cookies()
for cookie in cookies:
    print("%s -> %s" % (cookie['name'], cookie['value']))

print("=======================")
# 4.5 删除全部cookie
driver.delete_all_cookies()
print(driver.get_cookies())

# 5.关闭浏览器
sleep(2)
driver.quit()

参考:https://www.cnblogs.com/linguoguo/p/5106618.html

到此这篇关于Selenium对Cookie的操作 的文章就介绍到这了,更多相关Selenium Cookie操作 内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
Python和php通信乱码问题解决方法
Apr 15 Python
对Python Pexpect 模块的使用说明详解
Feb 14 Python
pandas修改DataFrame列名的实现方法
Feb 22 Python
如何基于python生成list的所有的子集
Nov 11 Python
PyTorch里面的torch.nn.Parameter()详解
Jan 03 Python
Python编程快速上手——PDF文件操作案例分析
Feb 28 Python
使用keras内置的模型进行图片预测实例
Jun 17 Python
Python叠加矩形框图层2种方法及效果
Jun 18 Python
Python自动创建Excel并获取内容
Sep 16 Python
基于Python制作一副扑克牌过程详解
Oct 19 Python
pycharm如何设置官方中文(如何汉化)
Dec 29 Python
Keras多线程机制与flask多线程冲突的解决方案
May 28 Python
Python常用配置文件ini、json、yaml读写总结
图文详解matlab原始处理图像几何变换
Django中session进行权限管理的使用
python利用pandas分析学生期末成绩实例代码
使用pandas生成/读取csv文件的方法实例
python自动化八大定位元素讲解
python实现简单聊天功能
You might like
php chr() ord()中文截取乱码问题解决方法
2008/09/08 PHP
php实现购物车产品删除功能(2)
2020/07/23 PHP
使用Codeigniter重写insert的方法(推荐)
2017/03/23 PHP
PHP切割整数工具类似微信红包金额分配的思路详解
2019/09/18 PHP
TNC vs BOOM BO3 第三场2.13
2021/03/10 DOTA
静态页面下用javascript操作ACCESS数据库(读增改删)的代码
2007/05/14 Javascript
javascript 全等号运算符使用说明
2010/05/31 Javascript
DOM Scripting中的图片切换[兼容Firefox]
2010/06/12 Javascript
JS远程获取网页源代码实例
2013/09/05 Javascript
javascript的数组和常用函数详解
2014/05/09 Javascript
深入理解JS中的substr和substring
2016/04/26 Javascript
AngularJs Scope详解及示例代码
2016/09/01 Javascript
jQuery ajax 当async为false时解决同步操作失败的问题
2016/11/18 Javascript
表格展示利器 Bootstrap Table实例代码
2017/09/06 Javascript
React从react-router路由上做登陆验证控制的方法
2018/05/10 Javascript
vue项目打包上传github并制作预览链接(pages)
2019/04/19 Javascript
在小程序中推送模板消息的实现方法
2019/07/22 Javascript
[01:06:07]2014 DOTA2国际邀请赛中国区预选赛5.21 DT VS CIS
2014/05/22 DOTA
[03:19]2016国际邀请赛中国区预选赛第四日TOP10镜头集锦
2016/07/01 DOTA
Python去除、替换字符串空格的处理方法
2018/04/01 Python
django 删除数据库表后重新同步的方法
2018/05/27 Python
python检测主机的连通性并记录到文件的实例
2018/06/21 Python
python matlibplot绘制多条曲线图
2021/02/19 Python
python得到qq句柄,并显示在前台的方法
2018/10/14 Python
python+playwright微软自动化工具的使用
2021/02/02 Python
澳大利亚小众服装品牌:Maurie & Eve
2018/03/27 全球购物
升职自荐书范文
2013/11/28 职场文书
营业员实习自我鉴定
2013/12/07 职场文书
计算机毕业生求职信
2014/06/10 职场文书
2014年感恩节活动策划方案
2014/10/06 职场文书
开展党的群众路线教育实践活动情况汇报
2014/11/05 职场文书
优秀教师个人材料
2014/12/15 职场文书
2015年清明节扫墓演讲稿
2015/03/18 职场文书
水浒传读书笔记
2015/06/25 职场文书
2019年公司卫生管理制度样本
2019/08/21 职场文书
Jupyter Notebook内使用argparse报错的解决方案
2021/06/03 Python