全网最全python库selenium自动化使用详细教程


Posted in Python onJanuary 12, 2021

一、安装selenium

pip install Selenium

二、初始化浏览器

  •  Chrome 是初始化谷歌浏览器
  • Firefox 是初始化火狐浏览器
  • Edge 是初始化IE浏览器
  • PhantomJS 是一个无界面浏览器。
from selenium import webdriver
 
driver = webdriver.Chrome()

三、设置浏览器大小

maximize_window 最大化窗口

set_window_size 自定义窗口大小

from selenium import webdriver
 
driver = webdriver.Chrome()
driver.maximize_window()

四、访问页面

from selenium import webdriver
 
driver = webdriver.Chrome()
 
driver.get('https://www.baidu.com')

五、定位元素

定位元素的基本方法如下

定位一个元素 定位多个元素 解释
find_element_by_id find_elements_by_id 通过元素id定位
find_element_by_name find_elements_by_name 通过元素name定位
find_element_by_xpath find_elements_by_xpath 通过xpath表达式定位
find_element_by_link_text find_elements_by_link_tex 通过完整超链接定位
find_element_by_partial_link_text find_elements_by_partial_link_text 通过部分链接定位
find_element_by_tag_name find_elements_by_tag_name 通过标签定位
find_element_by_class_name find_elements_by_class_name 通过类名进行定位
find_elements_by_css_selector find_elements_by_css_selector 通过css选择器进行定位

实例演示: 找到百度首页的输入框

from selenium import webdriver
 
driver = webdriver.Chrome()
driver.get('https://www.baidu.com')
driver.find_element_by_id('kw')

六、定位元素的另一种写法

需引入By模块

from selenium import webdriver
from selenium.webdriver.common.by import By
 
driver = webdriver.Chrome()
driver.get('https://www.baidu.com')
driver.find_element(By.ID, 'kw')

七、元素交互

方法 解释
click() 点击某个元素
send_keys(输入的值) 模拟输入
clear() 清除操作
submit() 提交表单
get_attribute(name) 获取元素的属性值
location 获取元素的位置
text 获取元素的文本值
size 获取元素的大小
id 获取元素的id值
tag_name 获取元素的标签名

实例演示: 在百度输入框中输入我是autofelix,并点击搜索按钮

from selenium import webdriver
 
driver = webdriver.Chrome()
driver.get('https://www.baidu.com')
driver.find_element_by_id('kw').send_keys('我是autofelix')
driver.find_element_by_id('su').click()

八、执行js

from selenium import webdriver
 
driver = webdriver.Chrome()
driver.maximize_window()
 
driver.get('https://www.baidu.com')
 
js_sql = '''
  document.getElementById('kw').value = '我是autofelix'
'''
driver.execute_script(js_sql)

九、Frame操作

  • 网页中frame的话,需要执行切入切出操作
  • switch_to.from(子iframe的id名称) 切入
  • switch_to.parent_frame(父iframe的id名称) 切出
from selenium import webdriver
 
driver = webdriver.Chrome()
driver.maximize_window()
 
driver.get('https://www.baidu.com')
 
//这个网址并没有iframe,我臆测有,你们看看就行
driver.switch_to.frame('我臆测出来的iframe')

十、cookie的操作

 

方法 说明
delete_all_cookies() 删除当前页面所有cookies
get_cookie(name) 获取指定cookie值
get_cookies() 获取当前页面所有cookies值
add_cookie() 设置cookie值

十一、选项卡管理

方法 解释
window_handles 保存所有选项卡的元组
switch_to.window() 切换选项卡
from selenium import webdriver
 
driver = webdriver.Chrome()
driver.maximize_window()
 
driver.get('https://www.baidu.com')
 
driver.delete_all_cookies()
driver.add_cookie({'name': 'name', 'domain': '.baidu.com', 'value': 'autofelix'})

十二、鼠标事件

鼠标事件需要引入ActionChains模块

方法 说明
move_to_element(above) 鼠标右击
double_click() 鼠标双击
drag_and_drop() 左键按住拖动
perform() 动作存储

实例演示: 滑动滑块验证码

from selenium import webdriver
from selenium.webdriver import ActionChains
from selenium.webdriver.common.by import By
from selenium.webdriver.support.wait import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
 
# 初始化谷歌浏览器
driver = webdriver.Chrome()
 
# 最大化窗口
driver.maximize_window()
 
# 打开头条登陆网址
driver.get('https://sso.toutiao.com')
 
# 等待某个元素是否出现
WebDriverWait(self.driver, 10).until(
  EC.text_to_be_present_in_element((By.XPATH, '//*[@id="mobile-code-get"]/span'), u'发送')
)
 
# 实例化鼠标操作
action = ActionChains(self.driver)
 
# 按住滑块
action.click_and_hold(self.driver.find_element_by_xpath('//*[@id="captcha_container"]')).perform()
 
# 将滑块移动x的距离
action.move_by_offset(xoffset=x, yoffset=0).perform()
 
# 释放滑块
action.release().perform()

十三、等待

  • 隐氏等待
  • 如果到一定时间,指定的元素还没有出现,进程不会阻塞,但是到指定时间还没有找到,就会抛出异常
from selenium import webdriver
 
driver = webdriver.Chrome()
driver.implicitly_wait(10)
 
driver.get('https://www.baidu.com')
  • 显示等待
  • 如果在一定时间内,指定的元素没有出现,进程会阻塞在这里,如果到指定时间还没有找到,就会抛出异常
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
 
driver = webdriver.Chrome()
driver.implicitly_wait(10)
 
driver.get('https://www.baidu.com')
WebDriverWait(driver, 10).until(
  EC.presence_of_element_located((By.ID, 'kw'))
)

十四、前进、后退和刷新

  • back 后退
  • forward 前进
  • refresh 刷新浏览器
from selenium import webdriver
driver = webdriver.Chrome()
driver.get('https://www.baidu.com')
driver.get('https://www.taobao.com')
driver.get('https://www.jd.com')
 
driver.back()
driver.forward()
driver.refresh()

十五、关闭浏览器

  • close 关闭当前标签页
  • quit 关闭整个浏览器
from selenium import webdriver
driver = webdriver.Chrome()
driver.get('https://www.baidu.com')
//打开百度页面后,关闭整个浏览器
driver.quit()

到此这篇关于全网最全python库selenium自动化使用教程的文章就介绍到这了,更多相关python库selenium自动化使用内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
Python定时执行之Timer用法示例
May 27 Python
Python 网页解析HTMLParse的实例详解
Aug 10 Python
Python 判断是否为质数或素数的实例
Oct 30 Python
SVM基本概念及Python实现代码
Dec 27 Python
详解pandas安装若干异常及解决方案总结
Jan 10 Python
python程序运行进程、使用时间、剩余时间显示功能的实现代码
Jul 11 Python
Python 元组拆包示例(Tuple Unpacking)
Dec 24 Python
Python如何实现在字符串里嵌入双引号或者单引号
Mar 02 Python
django之导入并执行自定义的函数模块图解
Apr 01 Python
Django框架请求生命周期实现原理
Nov 13 Python
Pytorch实验常用代码段汇总
Nov 19 Python
python使用requests库爬取拉勾网招聘信息的实现
Nov 20 Python
[原创]赚疯了!转手立赚800+?大佬的python「抢茅台脚本」使用教程
Jan 12 #Python
五分钟学会怎么用python做一个简单的贪吃蛇
Jan 12 #Python
python生成word合同的实例方法
Jan 12 #Python
python中常用的数据结构介绍
Jan 12 #Python
2020年10款优秀的Python第三方库,看看有你中意的吗?
Jan 12 #Python
python3 kubernetes api的使用示例
Jan 12 #Python
python excel和yaml文件的读取封装
Jan 12 #Python
You might like
php不使用插件导出excel的简单方法
2014/03/04 PHP
php实现Linux服务器木马排查及加固功能
2014/12/29 PHP
php中file_exists函数使用详解
2015/05/08 PHP
php通过会话控制实现身份验证实例
2016/10/18 PHP
图片延迟加载的实现代码(模仿懒惰)
2013/03/29 Javascript
js 获取(接收)地址栏参数值的方法
2013/04/01 Javascript
node.js入门教程
2014/06/01 Javascript
Javascript中的异步编程规范Promises/A详细介绍
2014/06/06 Javascript
jQuery中removeProp()方法用法实例
2015/01/05 Javascript
js使用心得分享
2015/01/13 Javascript
jQuery Easyui 验证两次密码输入是否相等
2016/05/13 Javascript
jQuery实现可以编辑的表格实例详解【附demo源码下载】
2016/07/09 Javascript
Bootstrap的fileinput插件实现多文件上传的方法
2016/09/05 Javascript
简单实现AngularJS轮播图效果
2020/04/10 Javascript
JavaScript mixin实现多继承的方法详解
2017/03/30 Javascript
深入理解Vue 的钩子函数
2018/09/05 Javascript
JS无限级导航菜单实现方法
2019/01/05 Javascript
layui+SSM的数据表的增删改实例(利用弹框添加、修改)
2019/09/27 Javascript
使用vue实现通过变量动态拼接url
2020/07/22 Javascript
一起来了解一下JavaScript的预编译(小结)
2021/03/01 Javascript
Python数据类型详解(一)字符串
2016/05/08 Python
python executemany的使用及注意事项
2017/03/13 Python
浅析Windows 嵌入python解释器的过程
2019/07/26 Python
python 爬虫网页登陆的简单实现
2020/11/30 Python
python快速安装OpenCV的步骤记录
2021/02/22 Python
HTML5注册表单的自动聚焦与占位文本示例代码
2013/07/19 HTML / CSS
HTML中meta标签及Keywords
2020/04/15 HTML / CSS
活动志愿者自荐信
2014/01/27 职场文书
会计专业应届生自荐信
2014/02/07 职场文书
《珍珠泉》教学反思
2014/02/20 职场文书
项目建议书格式
2014/03/12 职场文书
园艺专业毕业生求职信
2014/09/02 职场文书
2015年乡镇发展党员工作总结
2015/03/31 职场文书
学校学期工作总结
2015/08/13 职场文书
劳务派遣管理制度(样本)
2019/08/23 职场文书
如何打开Win11系统注册表编辑器?Win11注册表编辑器打开修复方法
2022/04/05 数码科技