全网最全python库selenium自动化使用详细教程


Posted in Python onJanuary 12, 2021

一、安装selenium

pip install Selenium

二、初始化浏览器

  •  Chrome 是初始化谷歌浏览器
  • Firefox 是初始化火狐浏览器
  • Edge 是初始化IE浏览器
  • PhantomJS 是一个无界面浏览器。
from selenium import webdriver
 
driver = webdriver.Chrome()

三、设置浏览器大小

maximize_window 最大化窗口

set_window_size 自定义窗口大小

from selenium import webdriver
 
driver = webdriver.Chrome()
driver.maximize_window()

四、访问页面

from selenium import webdriver
 
driver = webdriver.Chrome()
 
driver.get('https://www.baidu.com')

五、定位元素

定位元素的基本方法如下

定位一个元素 定位多个元素 解释
find_element_by_id find_elements_by_id 通过元素id定位
find_element_by_name find_elements_by_name 通过元素name定位
find_element_by_xpath find_elements_by_xpath 通过xpath表达式定位
find_element_by_link_text find_elements_by_link_tex 通过完整超链接定位
find_element_by_partial_link_text find_elements_by_partial_link_text 通过部分链接定位
find_element_by_tag_name find_elements_by_tag_name 通过标签定位
find_element_by_class_name find_elements_by_class_name 通过类名进行定位
find_elements_by_css_selector find_elements_by_css_selector 通过css选择器进行定位

实例演示: 找到百度首页的输入框

from selenium import webdriver
 
driver = webdriver.Chrome()
driver.get('https://www.baidu.com')
driver.find_element_by_id('kw')

六、定位元素的另一种写法

需引入By模块

from selenium import webdriver
from selenium.webdriver.common.by import By
 
driver = webdriver.Chrome()
driver.get('https://www.baidu.com')
driver.find_element(By.ID, 'kw')

七、元素交互

方法 解释
click() 点击某个元素
send_keys(输入的值) 模拟输入
clear() 清除操作
submit() 提交表单
get_attribute(name) 获取元素的属性值
location 获取元素的位置
text 获取元素的文本值
size 获取元素的大小
id 获取元素的id值
tag_name 获取元素的标签名

实例演示: 在百度输入框中输入我是autofelix,并点击搜索按钮

from selenium import webdriver
 
driver = webdriver.Chrome()
driver.get('https://www.baidu.com')
driver.find_element_by_id('kw').send_keys('我是autofelix')
driver.find_element_by_id('su').click()

八、执行js

from selenium import webdriver
 
driver = webdriver.Chrome()
driver.maximize_window()
 
driver.get('https://www.baidu.com')
 
js_sql = '''
  document.getElementById('kw').value = '我是autofelix'
'''
driver.execute_script(js_sql)

九、Frame操作

  • 网页中frame的话,需要执行切入切出操作
  • switch_to.from(子iframe的id名称) 切入
  • switch_to.parent_frame(父iframe的id名称) 切出
from selenium import webdriver
 
driver = webdriver.Chrome()
driver.maximize_window()
 
driver.get('https://www.baidu.com')
 
//这个网址并没有iframe,我臆测有,你们看看就行
driver.switch_to.frame('我臆测出来的iframe')

十、cookie的操作

 

方法 说明
delete_all_cookies() 删除当前页面所有cookies
get_cookie(name) 获取指定cookie值
get_cookies() 获取当前页面所有cookies值
add_cookie() 设置cookie值

十一、选项卡管理

方法 解释
window_handles 保存所有选项卡的元组
switch_to.window() 切换选项卡
from selenium import webdriver
 
driver = webdriver.Chrome()
driver.maximize_window()
 
driver.get('https://www.baidu.com')
 
driver.delete_all_cookies()
driver.add_cookie({'name': 'name', 'domain': '.baidu.com', 'value': 'autofelix'})

十二、鼠标事件

鼠标事件需要引入ActionChains模块

方法 说明
move_to_element(above) 鼠标右击
double_click() 鼠标双击
drag_and_drop() 左键按住拖动
perform() 动作存储

实例演示: 滑动滑块验证码

from selenium import webdriver
from selenium.webdriver import ActionChains
from selenium.webdriver.common.by import By
from selenium.webdriver.support.wait import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
 
# 初始化谷歌浏览器
driver = webdriver.Chrome()
 
# 最大化窗口
driver.maximize_window()
 
# 打开头条登陆网址
driver.get('https://sso.toutiao.com')
 
# 等待某个元素是否出现
WebDriverWait(self.driver, 10).until(
  EC.text_to_be_present_in_element((By.XPATH, '//*[@id="mobile-code-get"]/span'), u'发送')
)
 
# 实例化鼠标操作
action = ActionChains(self.driver)
 
# 按住滑块
action.click_and_hold(self.driver.find_element_by_xpath('//*[@id="captcha_container"]')).perform()
 
# 将滑块移动x的距离
action.move_by_offset(xoffset=x, yoffset=0).perform()
 
# 释放滑块
action.release().perform()

十三、等待

  • 隐氏等待
  • 如果到一定时间,指定的元素还没有出现,进程不会阻塞,但是到指定时间还没有找到,就会抛出异常
from selenium import webdriver
 
driver = webdriver.Chrome()
driver.implicitly_wait(10)
 
driver.get('https://www.baidu.com')
  • 显示等待
  • 如果在一定时间内,指定的元素没有出现,进程会阻塞在这里,如果到指定时间还没有找到,就会抛出异常
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
 
driver = webdriver.Chrome()
driver.implicitly_wait(10)
 
driver.get('https://www.baidu.com')
WebDriverWait(driver, 10).until(
  EC.presence_of_element_located((By.ID, 'kw'))
)

十四、前进、后退和刷新

  • back 后退
  • forward 前进
  • refresh 刷新浏览器
from selenium import webdriver
driver = webdriver.Chrome()
driver.get('https://www.baidu.com')
driver.get('https://www.taobao.com')
driver.get('https://www.jd.com')
 
driver.back()
driver.forward()
driver.refresh()

十五、关闭浏览器

  • close 关闭当前标签页
  • quit 关闭整个浏览器
from selenium import webdriver
driver = webdriver.Chrome()
driver.get('https://www.baidu.com')
//打开百度页面后,关闭整个浏览器
driver.quit()

到此这篇关于全网最全python库selenium自动化使用教程的文章就介绍到这了,更多相关python库selenium自动化使用内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python list中append()与extend()用法分享
Mar 24 Python
python数据结构之二叉树的遍历实例
Apr 29 Python
Python中的引用和拷贝浅析
Nov 22 Python
Python生成随机密码
Mar 10 Python
python插入数据到列表的方法
Apr 30 Python
python中函数总结之装饰器闭包详解
Jun 12 Python
Python中的函数作用域
May 07 Python
Python 获取中文字拼音首个字母的方法
Nov 28 Python
解决django同步数据库的时候app models表没有成功创建的问题
Aug 09 Python
对Pytorch中Tensor的各种池化操作解析
Jan 03 Python
Python操作PostgreSql数据库的方法(基本的增删改查)
Dec 29 Python
python实现一个简单的贪吃蛇游戏附代码
Jun 28 Python
[原创]赚疯了!转手立赚800+?大佬的python「抢茅台脚本」使用教程
Jan 12 #Python
五分钟学会怎么用python做一个简单的贪吃蛇
Jan 12 #Python
python生成word合同的实例方法
Jan 12 #Python
python中常用的数据结构介绍
Jan 12 #Python
2020年10款优秀的Python第三方库,看看有你中意的吗?
Jan 12 #Python
python3 kubernetes api的使用示例
Jan 12 #Python
python excel和yaml文件的读取封装
Jan 12 #Python
You might like
php笔记之:数据类型与常量的使用分析
2013/05/14 PHP
YII实现分页的方法
2014/07/09 PHP
PHP的邮件群发系统phplist配置方法详细总结
2016/03/30 PHP
laravel-admin 管理平台获取当前登陆用户信息的例子
2019/10/08 PHP
PHP PDO和消息队列的个人理解与应用实例分析
2019/11/25 PHP
详解PHP中curl_multi并发的实现
2020/06/08 PHP
node.js中使用socket.io的方法
2014/12/15 Javascript
js实现刷新iframe的方法汇总
2015/04/27 Javascript
node.js+express制作网页计算器
2016/01/17 Javascript
Vuejs第十三篇之组件——杂项
2016/09/09 Javascript
jQuery将表单序列化成一个Object对象的实例
2016/11/29 Javascript
EasyUI学习之Combobox下拉列表(1)
2016/12/29 Javascript
nodejs和C语言插入mysql数据库乱码问题的解决方法
2017/04/14 NodeJs
浅谈angularjs依赖服务注入写法的注意点
2017/04/24 Javascript
详解微信小程序input标签正则初体验
2018/08/18 Javascript
node.js使用express框架进行文件上传详解
2019/03/03 Javascript
python中nan与inf转为特定数字方法示例
2017/05/11 Python
python爬虫把url链接编码成gbk2312格式过程解析
2020/06/08 Python
opencv 图像礼帽和图像黑帽的实现
2020/07/07 Python
Python Charles抓包配置实现流程图解
2020/09/29 Python
最新版 Windows10上安装Python 3.8.5的步骤详解
2020/11/28 Python
python从ftp获取文件并下载到本地
2020/12/05 Python
全球知名的珠宝首饰品牌:Kay Jewelers
2018/02/11 全球购物
英国大码女性时装零售商:Evans
2018/08/29 全球购物
ALDO加拿大官网:加拿大女鞋品牌
2018/12/22 全球购物
美国用餐电影院:Alamo Drafthouse Cinema
2020/01/23 全球购物
Delphi笔试题
2016/11/14 面试题
成人教育自我鉴定
2013/11/01 职场文书
童装店创业计划书
2014/01/09 职场文书
最新茶叶店创业计划书
2014/01/14 职场文书
班主任与学生安全责任书
2014/07/25 职场文书
南京市纪委监察局整改方案
2014/09/16 职场文书
自查自纠工作总结
2014/10/15 职场文书
出国导师推荐信
2015/03/25 职场文书
公司保洁员管理制度
2015/08/04 职场文书
openstack中的rpc远程调用的方法
2021/07/09 Python