Selenium 安装和简单使用的实现


Posted in Python onDecember 04, 2020

一、简介

Selenium是一个用于Web应用程序测试的工具。

Selenium测试直接运行在浏览器中,就像真正的用户在操作一样。支持的浏览器包括IE,Firefox,Safari,Chrome,Opera等。

在爬虫上用来模拟正常用户访问网页并获取数据。

二、安装(以Chrome为例)

浏览器安装

windows下安装就不多说了,以下为服务器(Centos7)的安装步骤

#下载安装包到同级目录下
wget https://dl.google.com/linux/direct/google-chrome-stable_current_x86_64.rpm

#安装
yum install ./google-chrome-stable_current_x86_64.rpm

Selenium安装

pip install selenium

驱动下载

selenium是通过ChromeDriver调用的Chrome浏览器(其他主流浏览器也有相应驱动),所以需要下载ChromeDriver,而且ChromeDriver版本需要与Chrome的版本对应,版本错误的话则会运行报错。

(1)查看Chrome浏览器版本

Windows系统查看方法:打开Chrome浏览器 > 右上角三个点 > 设置 > 关于Chrome

Selenium 安装和简单使用的实现

Centos7 查看方法:google-chrome --version

Selenium 安装和简单使用的实现

(2)下载相应版本的驱动

下载地址:

Chrome浏览器驱动(ChromeDriver):http://npm.taobao.org/mirrors/chromedriver/

备用地址
Firefox浏览器驱动(GeckoDriver):https://github.com/mozilla/geckodriver/releases
IE浏览器驱动:http://selenium-release.storage.googleapis.com/index.html
Edge浏览器驱动:https://developer.microsoft.com/en-us/microsoft-edge/tools/webdriver/
Opera浏览器驱动:https://github.com/operasoftware/operachromiumdriver/releases
PhantomJS浏览器驱动:https://phantomjs.org/

找到相应的版本:

可以看到我的Chrome版本为78.0.3904.108,在上述网址中找到对应的版本,对应大版本(例:78)即可。

Selenium 安装和简单使用的实现

里边有四个文件,前三个对应相应的系统(不用区分64位还是32位),notes.txt文件里说明了更新内容和支持版本

Selenium 安装和简单使用的实现

(3)ChromeDriver安装

Mac/Linux:下载完成解压后,将文件移动至/usr/local/bin目录中,则可以正常使用
Windows:下载完成解压后,将文件移动到一个配置了环境变量的文件夹中,例如你的Python安装文件夹。

三、 简单使用

这是一个打开百度首页,在输入框中输入‘平头哥儿'的例子。

import time
from selenium import webdriver

# 打开一个Chrome浏览器
driver = webdriver.Chrome() #Chrome浏览器
#driver = webdriver.Chrome(r'ChromeDriver路径') #还可以指定路径
#driver = webdriver.Firefox() 				 # Firefox浏览器
#driver = webdriver.Ie() # IE浏览器
#driver = webdriver.Edge() # Edge浏览器
#driver = webdriver.Opera() # Opera浏览器
#driver = webdriver.PhantomJS() # PhantomJS浏览器

# 请求百度首页
driver.get('https://www.baidu.com')

time.sleep(5) #方便演示,等待五秒

#找到输入框位置,并输入'平头哥儿',百度特性(输入完内容会自动查)
driver.find_element_by_xpath('//*[@id="kw"]').send_keys('平头哥儿')

time.sleep(5) #方便演示,等待五秒

driver.quit() #关闭全部窗口

Selenium文集传送门:

标题 简介
Python爬虫 - Selenium(1)安装和简单使用 详细介绍Selenium的依赖环境在Windows和Centos7上的安装及简单使用
Python爬虫 - Selenium(2)元素定位和WebDriver常用方法 详细介绍定位元素的8种方式并配合点击和输入、提交、获取断言信息等方法的使用
Python爬虫 - Selenium(3)控制浏览器的常用方法 详细介绍自定义浏览器窗口大小或全屏、控制浏览器后退、前进、刷新浏览器等方法的使用
Python爬虫 - Selenium(4)配置启动项参数 详细介绍Selenium启动项参数的配置,其中包括无界面模式、浏览器窗口大小设置、浏览器User-Agent (请求头)等等
Python爬虫 - Selenium(5)鼠标事件 详细介绍鼠标右击、双击、拖动、鼠标悬停等方法的使用
Python爬虫 - Selenium(6)键盘事件 详细介绍键盘的操作,几乎包含所有常用按键以及组合键
Python爬虫 - Selenium(7)多窗口切换 详细介绍Selenium是如何实现在不同的窗口之间自由切换
Python爬虫 - Selenium(8)frame/iframe表单嵌套页面 详细介绍如何从当前定位的主体切换为frame/iframe表单的内嵌页面中
Python爬虫 - Selenium(9)警告框(弹窗)处理 详细介绍如何定位并处理多类警告弹窗
Python爬虫 - Selenium(10)下拉框处理 详细介绍如何灵活的定位并处理下拉框
Python爬虫 - Selenium(11)文件上传 详细介绍如何优雅的通过send_keys()指定文件进行上传
Python爬虫 - Selenium(12)获取登录Cookies,并添加Cookies自动登录 详细介绍如何获取Cookies和使用Cookies进行自动登录
Python爬虫 - Selenium(13)设置元素等待 详细介绍如何优雅的设置元素等待时间,防止程序运行过快而导致元素定位失败
Python爬虫 - Selenium(14)窗口截图 详细介绍如何使用窗口截图
Python爬虫 - Selenium(15)关闭浏览器 详细介绍两种关闭窗口的区别

到此这篇关于Selenium 安装和简单使用的实现的文章就介绍到这了,更多相关Selenium 安装使用内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
跟老齐学Python之折腾一下目录
Oct 24 Python
python循环监控远程端口的方法
Mar 14 Python
Python信息抽取之乱码解决办法
Jun 29 Python
numpy使用fromstring创建矩阵的实例
Jun 15 Python
pygame游戏之旅 如何制作游戏障碍
Nov 20 Python
Django生成PDF文档显示在网页上以及解决PDF中文显示乱码的问题
Jul 04 Python
用python写一个定时提醒程序的实现代码
Jul 22 Python
Pytorch技巧:DataLoader的collate_fn参数使用详解
Jan 08 Python
python实现提取str字符串/json中多级目录下的某个值
Feb 27 Python
pycharm如何使用anaconda中的各种包(操作步骤)
Jul 31 Python
python如何操作mysql
Aug 17 Python
2021年pycharm的最新安装教程及基本使用图文详解
Apr 03 Python
python 爬虫之selenium可视化爬虫的实现
Dec 04 #Python
Python实现中英文全文搜索的示例
Dec 04 #Python
一文带你了解Python 四种常见基础爬虫方法介绍
Dec 04 #Python
使用Python通过oBIX协议访问Niagara数据的示例
Dec 04 #Python
python飞机大战游戏实例讲解
Dec 04 #Python
python 根据列表批量下载网易云音乐的免费音乐
Dec 03 #Python
python中字符串的编码与解码详析
Dec 03 #Python
You might like
php简单开启gzip压缩方法(zlib.output_compression)
2013/04/13 PHP
ThinkPHP模板输出display用法分析
2014/11/26 PHP
PHP读取txt文本文件并分页显示的方法
2015/03/11 PHP
常见PHP数据库解决方案分析介绍
2015/09/24 PHP
php判断邮箱地址是否存在的方法
2016/02/13 PHP
yii 框架实现按天,月,年,自定义时间段统计数据的方法分析
2020/04/04 PHP
Alliance vs AM BO3 第二场2.13
2021/03/10 DOTA
LBS blog sql注射漏洞[All version]-官方已有补丁
2007/08/26 Javascript
jQuery ajax BUG:object doesn't support this property or method
2010/07/06 Javascript
Extjs单独定义各组件的实例代码
2013/06/25 Javascript
JQuery插件开发示例代码
2013/11/06 Javascript
jQuery获得页面元素的绝对/相对位置即绝对X,Y坐标
2014/03/06 Javascript
jQuery+PHP星级评分实现方法
2015/10/02 Javascript
javascript类型系统——undefined和null全面了解
2016/07/13 Javascript
Bootstrap基本插件学习笔记之轮播幻灯片(23)
2016/12/08 Javascript
JavaScript数据结构之二叉树的遍历算法示例
2017/04/13 Javascript
javascript 开发之百度地图使用到的js函数整理
2017/05/19 Javascript
WdatePicker.js时间日期插件的使用方法
2017/07/26 Javascript
解决React Native端口号修改的方法
2017/07/28 Javascript
Three.js实现浏览器变动时进行自适应的方法
2017/09/26 Javascript
Node.js fs模块(文件模块)创建、删除目录(文件)读取写入文件流的方法
2019/09/03 Javascript
Vue仿百度搜索功能
2020/12/28 Vue.js
[00:11]战神迅矛
2019/03/06 DOTA
详解Python pygame安装过程笔记
2017/06/05 Python
python使用turtle库绘制时钟
2020/03/25 Python
python实现文字版扫雷
2020/04/24 Python
python 进程池pool使用详解
2020/10/15 Python
深入解析HTML5使用SVG图像时的viewBox属性用法
2015/09/02 HTML / CSS
办公室主任职责范文
2013/11/08 职场文书
营销专业应届生求职信
2013/11/26 职场文书
生育关怀行动实施方案
2014/03/26 职场文书
教师节学生演讲稿
2014/09/03 职场文书
2014年学校德育工作总结
2014/12/05 职场文书
寻找成龙观后感
2015/06/12 职场文书
2016三严三实专题教育活动心得体会
2016/01/06 职场文书
总结一些Java常用的加密算法
2021/06/11 Java/Android