编程 Python

Selenium的使用详解

Posted in Python onOctober 19, 2018

先来看一下功能实现，代码如下：

from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.common.keys import Keys
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver.support.wait import WebDriverWait
#声明浏览器对象
browser = webdriver.Chrome()
try:
  browser.get('https:www.baidu.com')
  input = browser.find_element_by_id('kw')
  input.send_keys('Python')
  input.send_keys(Keys.ENTER)
  wait = WebDriverWait(browser,10)
  wait.until(EC.presence_of_element_located((By.ID,'content_left')))
  print(browser.current_url)
  print(browser.get_cookies())
  print(browser.page_source)
finally:
  browser.close()

可以看到打开了百度网站，查询了“Python”并且输出了当前的url，cookies还有网页源代码。

下面再来介绍详细功能。

1、声明浏览器对象。

browser = webdriver.Chrome()
browser = webdriver.Firefox()

浏览器的对象初始化，并将其赋值给browser对象。

2.以淘宝为例，请求网页。

browser = webdriver.Chrome()
browser.get('https://www.taobao.com')
print(browser.page_source)
browser.close()

可以看到输出了淘宝的源码，随后关闭。

3.查找节点

单个节点

提取搜索框这个节点

检查搜索框如下：

Selenium的使用详解

查找搜索框：

browser = webdriver.Chrome()
browser.get('https://www.taobao.com')
# 通过id查找
input_first = browser.find_element_by_id('q')
# 通过css查找
input_second = browser.find_element_by_css_selector('#q')
# 通过xpath查找
input_third = browser.find_element_by_xpath('//*[@id="q"]')
print(input_first,input_second,input_third)
browser.close()

# 查找单个节点的方法
find_element_by_id
find_element_by_name
find_element_by_xpath
find_element_by_link_text
find_element_by_partial_link_text
find_element_by_tag_name
find_element_by_class_name
find_element_by_css_selector

通用方法查找：

browser = webdriver.Chrome()
browser.get('https://www.taobao.com')
input_first = browser.find_element(By.ID,'q')
print(input_first)
browser.close()

find_element()里面需要两个参数，查找方式By和值，
例如：find_element(By.ID,'q') 通过查找ID的当时，查找id为q。

多个节点：

例如左侧的导航条所有条目：

Selenium的使用详解

browser = webdriver.Chrome()
browser.get('https://www.taobao.com')
lis = browser.find_elements_by_css_selector('.service-bd li')
print(lis)
browser.close()

获取多个节点的方法：

find_elements_by_id
find_elements_by_name
find_elements_by_xpath
find_elements_by_link_text
find_elements_by_partial_link_text
find_elements_by_tag_name
find_elements_by_class_name
find_elements_by_css_selector

通用方法在这里同样适用。

4、节点交互

import time
browser = webdriver.Chrome()
browser.get('https://www.taobao.com')
input = browser.find_element_by_id('q')
# 输入文字用send_keys()
input.send_keys('ipone')
time.sleep(1)
#清空文字用clear()
input.clear()
input.send_keys('ipad')
button = browser.find_element_by_class_name('btn-search')
#点击
button.click()

5、动作链

from selenium import webdriver
from selenium.webdriver import ActionChains
browser = webdriver.Chrome()
url = 'http://www.runoob.com/try/try.php?filename=jqueryui-api-droppable'
browser.get(url)
browser.switch_to.frame('iframeResult')
#找到被拖拽的标签
source = browser.find_element_by_css_selector('#draggable')
#找到拖拽目的地的标签
target = browser.find_element_by_css_selector('#droppable')
actions = ActionChains(browser)
actions.drag_and_drop(source,target)
actions.perform()

运行结果如下：

Selenium的使用详解

6、执行JavaScript

例如下拉进度条，可以直接模拟运行JavaScript，适用execute_script()即可实现

from selenium import webdriver
browser = webdriver.Chrome()
browser.get('https://www.zhihu.com/explore')
browser.execute_script('window.scrollTo(0,document.body.scrollHeight)')
browser.execute_script('alert("To Bottom")')

将滚动条拉到底部，执行结果如下：

Selenium的使用详解

7、获取节点信息

获取属性

Selenium的使用详解

代码如下：

from selenium import webdriver
browser = webdriver.Chrome()
browser.get('https://www.zhihu.com/explore')
logo = browser.find_element_by_id('zh-top-link-logo')
print(logo)
# 获取class属性
print(logo.get_attribute('class'))

获取文本值

Selenium的使用详解

代码如下：

from selenium import webdriver
browser = webdriver.Chrome()
browser.get('https://www.zhihu.com/explore')
input = browser.find_element_by_class_name('zu-top-add-question')
print(input.text)

输出结果如下：

Selenium的使用详解

获取id、位置、标签名和大小

以上面的标签为例：

from selenium import webdriver
browser = webdriver.Chrome()
browser.get('https://www.zhihu.com/explore')
input = browser.find_element_by_class_name('zu-top-add-question')
print(input.id)
# 输出位置
print(input.location)
#标签名
print(input.tag_name)
#大小
print(input.size)

输出结果：

Selenium的使用详解

8、界面切换

代码如下：

from selenium import webdriver
from selenium.common.exceptions import NoSuchElementException
browser = webdriver.Chrome()
browser.get('http://www.runoob.com/try/try.php?filename=jqueryui-api-droppable')
#界面切换到子界面
browser.switch_to.frame('iframeResult')
try:
  # 查找logo
  logo = browser.find_element_by_class_name('logo')
except NoSuchElementException:
  print('NO LOGO')
  # 界面切换到父级界面
browser.switch_to.parent_frame()
# 查找logo
logo = browser.find_element_by_class_name('logo')
print(logo)
print(logo.text)

9、延时等待

隐式等待

当selenium没有在DOM中找到节点，继续等待，超出设定时间，抛出异常

browser = webdriver.Chrome()
browser.implicitly_wait(10)
browser.get('https://www.zhihu.com/explore')
input = browser.find_element_by_class_name('zu-top-add-question')
print(input)

显式等待

指定要查找的节点，然后指定一个最长等待时间，如果在规定时间内加载出来节点，返回节点，如果超出规定时间，抛出异常。

browser = webdriver.Chrome()
browser.get('https://www.taobao.com/')
wait = WebDriverWait(browser,10)
input = wait.until(EC.presence_of_element_located((By.ID,'q')))
# 节点可点击
button = wait.until(EC.element_to_be_clickable((By.CSS_SELECTOR,'.btn-search')))
print(input,button)

10、Cookies

browser = webdriver.Chrome()
browser.get('https://www.zhihu.com/explore')
# 获取cookies
print(browser.get_cookies())
# 添加cookie
browser.add_cookie({'name':'name','domin':'www.zhihu.com','value':'germey'})
print(browser.get_cookies())
# 删除所有的cookies
browser.delete_all_cookies()
print(browser.get_cookies())

输出结果：

Selenium的使用详解

总结

以上就是这篇文章的全部内容了，希望本文的内容对大家的学习或者工作具有一定的参考学习价值，谢谢大家对三水点靠木的支持。如果你想了解更多相关内容请查看下面相关链接

Selenium的使用详解

- Author -

回忆不说话

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

Python随机生成数模块random使用实例

Apr 13 Python

视觉直观感受若干常用排序算法

Apr 13 Python

Python通过future处理并发问题

Oct 17 Python

django中的HTML控件及参数传递方法

Mar 20 Python

Python 实现在文件中的每一行添加一个逗号

Apr 29 Python

python-Web-flask-视图内容和模板知识点西宁街

Aug 23 Python

解决Jupyter NoteBook输出的图表太小看不清问题

Apr 16 Python

python库skimage给灰度图像染色的方法示例

Apr 27 Python

Python代码需要缩进吗

Jul 01 Python

python如何写try语句

Jul 14 Python

Python图像处理之图像拼接

Apr 28 Python

关于Numpy之repeat、tile的用法总结

Jun 02 Python

Python爬取成语接龙类网站

Oct 19 #Python

将Django项目部署到CentOs服务器中

Oct 18 #Python

python中将zip压缩包转为gz.tar的方法

Oct 18 #Python

Python 忽略warning的输出方法

Oct 18 #Python

解决python通过cx_Oracle模块连接Oracle乱码的问题

Oct 18 #Python

解决python3捕获cx_oracle抛出的异常错误问题

Oct 18 #Python

python 自定义异常和异常捕捉的方法

Oct 18 #Python

You might like

百度地图API应用之获取用户的具体位置

2014/06/10 PHP

人脸识别测颜值、测脸龄、测相似度微信接口

2016/04/07 PHP

基于PHPexecl类生成复杂的报表表头示例

2016/10/14 PHP

PHP实现非阻塞模式的方法分析

2018/07/26 PHP

jquery获取ASP.NET服务器端控件dropdownlist和radiobuttonlist生成客户端HTML标签后的value和text值

2010/06/28 Javascript

浅谈Javascript事件处理程序的几种方式

2012/06/27 Javascript

js脚本分页代码分享（7种样式）

2015/08/19 Javascript

jquery实现的仿天猫侧导航tab切换效果

2015/08/24 Javascript

chrome浏览器当表单自动填充时如何去除浏览器自动添加的默认样式

2015/10/09 Javascript

学习Javascript面向对象编程之封装

2016/02/23 Javascript

使用jQuery的toggle()方法对HTML标签进行显示、隐藏的方法(示例)

2016/09/01 Javascript

jQuery源码分析之init的详细介绍

2017/02/13 Javascript

详解用node编写自己的cli工具

2017/05/23 Javascript

javascript观察者模式实现自动刷新效果

2017/09/05 Javascript

JS基于贪心算法解决背包问题示例

2017/11/27 Javascript

基于zTree树形菜单的使用实例

2017/12/25 Javascript

解决vue打包之后静态资源图片失效的问题

2018/02/21 Javascript

解决nodejs的npm命令无反应的问题

2018/05/17 NodeJs

jQuery实现的简单获取索引功能示例

2018/06/04 jQuery

Vue3.x源码调试的实现方法

2019/10/13 Javascript

vue实现拖拽进度条

2021/03/01 Vue.js

[19:59]2014DOTA2国际邀请赛 IG战队纪录片

2014/08/07 DOTA

TensorFlow 实战之实现卷积神经网络的实例讲解

2018/02/26 Python

python 实现判断ip连通性的方法总结

2018/04/22 Python

python基于http下载视频或音频

2018/06/20 Python

python版opencv摄像头人脸实时检测方法

2018/08/03 Python

用Python将结果保存为xlsx的方法

2019/01/28 Python

你需要学会的8个Python列表技巧

2020/06/24 Python

基于Python 的语音重采样函数解析

2020/07/06 Python

公司业务主管岗位职责

2013/12/07 职场文书

模具专业毕业生自荐书范文

2014/02/19 职场文书

学生自我评语

2015/01/04 职场文书

CSS3 制作的彩虹按钮样式

2021/04/11 HTML / CSS

Oracle 数据仓库ETL技术之多表插入语句的示例详解

2021/04/12 Oracle

解决golang post文件时Content-Type出现的问题

2021/05/02 Golang

cypress测试本地web应用

2022/06/01 Javascript