python+selenium实现登录账户后自动点击的示例


Posted in Python onDecember 22, 2017

公司在codereview的时候限制了看代码的时间,实际上不少代码属于框架自动生成,并不需要花费太多时间看,为了达标,需要刷点时间(鼠标点击网页固定区域)。我想到可以利用自动化测试的手段完成这种无效的体力劳动。

首先,明确一下需求:

  1. 自动打开网页
  2. 登陆账号 
  3. 每隔一定时间点击一下固定区域

我想到的方案有两个,sikuli或者python+selenium。sikuli的优点是逻辑操作简单直接,使用图片作为标示,缺点是需要窗口固定,并且无法后台运行。selenium稍复杂一定,但是运行速度快,窗口可以遮挡。

这里简单记录一下使用Python+selenium的小例子。

使用的版本为Python3.3以及selenium2,Windows环境(现在已经支持3.0以上的了,多处论坛博客没有更新)。

首先是软件的安装,Python不赘述了,记得设置环境变量。

下面安装selenium,如果已经安装过pip。直接运行一下命令。

pip install -U selenium

另一种方式,https://pypi.python.org/packages/source/s/selenium/selenium-2.52.0.tar.gz下载并解压。这里简述一下windows版本,其实Unix下也差不多,使用Wget下载一下安装。

使用命令(setup一般用于第三方模块的安装):

cd c:\Python3\xxxx
python setup.py install

安装过程中可能会出现ImportError: No module named setuptools,这是因为缺少setuptools模块,Python默认不安装。

在http://pypi.python.org/pypi/setuptools上面提供了各系统的安装包和安装指南,对于Windows系统,下载https://bootstrap.pypa.io/ez_setup.py自动化安装脚本。

运行:

python ez_setup.py

完成后再安装selenium即可。

这里用我自己的实例简单的讲解一下流程。

第一步先完成打开浏览器。

selenium2结合了selenium和webdriver,直接引入各个浏览器相应的驱动,打开即可,注意chrome驱动可能需要另行安装。

from selenium import webdriver
browser = webdriver.Firefox()
browser.get('https://www.xxx.com')

打开网页后需要登录,F12打开浏览器调试器,小箭头选取元素,查看登录框账号和密码的属性,一般都有ID。selenium可以通过以下各个方法获取元素并进行各种操作,具体解释请看上方链接文档:

  1. find_element_by_id
  2. find_element_by_name
  3. find_element_by_xpath
  4. find_element_by_link_text
  5. find_element_by_partial_link_text
  6. find_element_by_tag_name
  7. find_element_by_class_name
  8. find_element_by_css_selector

其中id最为有效方便,优先考虑。选取完元素之后可以通过WebDriver API调用模拟键盘的输入和鼠标的点击操作。代码如下:

username="qun" 
passwd="passwd"
browser = webdriver.Firefox()
browser.get('https://www.xxx.com')
browser.implicitly_wait(10)
elem=browser.find_element_by_id("loginFormUserName")
elem.send_keys(username)
elem=browser.find_element_by_id("loginFormPassword")
elem.send_keys(passwd)
elem=browser.find_element_by_id("loginFormSubmit")
elem.click()

一般登录之后页面都会跳转到新的网页上,如何获取新的网页呢?这里有个窗口句柄的概念,通过切换窗口句柄来完成。注意!有时候元素在一个frame里面的时候,也需要通过swtich切换。这里出现一个wait函数(上面也有),是因为页面加载需要时间,很可能在点击之后元素才加载出来,下一节详细解释一下wait。

browser.implicitly_wait(10)
browser.switch_to_window(browser.window_handles[-1])

之后选取需要点击的区域,这里使用 xpath定位,因为在自动化测试的过程中,很有可能元素无法通过id,name等方法定位(不少人就是不写,爱table套table,我也么办法),xpath就有了用武之地。常用的偷懒方法是Firefox安装xpath插件,右键直接获取。这里不介绍,因为不提倡,使用插件会造成代码里充斥这样的东西:

XPath(/html/body/div/div[3]/div[2]/div[4]/p[2])

不到万不得已,尽可能使用元素的特征来定位,比如按钮的name。

或者通过父元素定位子元素。

username =browser.find_element_by_xpath("//input[@name='username']")
clear_button = browser.find_element_by_xpath("//form[@id='loginForm']/input[4]")

代码如下,网上经常出现的By的用法需要引入包。

from selenium.webdriver.common.by import By

这里使用另外一个函数,我不知道有什么区别- -。

for i in range(100):
  elem=WebDriverWait(browser, 30).until(
    lambda x:x.find_element_by_xpath("//table[@class='aaa']"/td[1]))
  elem.click()
  time.sleep(20)
  print ("click",i)

然后这里还要提一下wait函数,在selenium2中延迟等待分为两种,显示等待和隐式等待。  

显示等待

显式等待,就是明确的要等到某个元素的出现或者是某个元素的可点击等条件,等不到,就一直等,除非在规定的时间之内都没找到,那么就跳出Exception。

element = WebDriverWait(driver, 10).until(
    EC.presence_of_element_located((By.ID, "myDynamicElement"))
  )

隐式等待

注意,隐式等待是告诉设置所有dom元素在寻找某个元素的时候,如果没立即找到,再尝试这么长时间。

browser.implicitly_wait(10) # seconds

两者的区别在于一个是自己直接管理超时对象,一个是交给webdriver去做。

当然也可以用休眠的方法干等。记得引入time包。

time.sleep(20)

这里只是简单的演示一下用法,有许多可以改进的地方,没有封装函数,么有使用多线程并发执行多个例程。以后有需求再改进。

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python实现simhash算法实例
Apr 25 Python
利用Python和OpenCV库将URL转换为OpenCV格式的方法
Mar 27 Python
简单介绍Python中的RSS处理
Apr 13 Python
Python记录详细调用堆栈日志的方法
May 05 Python
Python中字符串的修改及传参详解
Nov 30 Python
python调用百度REST API实现语音识别
Aug 30 Python
详解django自定义中间件处理
Nov 21 Python
Django1.11自带分页器paginator的使用方法
Oct 31 Python
GDAL 矢量属性数据修改方式(python)
Mar 10 Python
Python ORM框架Peewee用法详解
Apr 29 Python
基于Python脚本实现邮件报警功能
May 20 Python
python 自动化偷懒的四个实用操作
Apr 11 Python
python实现决策树
Dec 21 #Python
python利用sklearn包编写决策树源代码
Dec 21 #Python
python实现决策树分类算法
Dec 21 #Python
Python语言描述机器学习之Logistic回归算法
Dec 21 #Python
python Crypto模块的安装与使用方法
Dec 21 #Python
python编写Logistic逻辑回归
Dec 30 #Python
python+selenium识别验证码并登录的示例代码
Dec 21 #Python
You might like
PHP 截取字符串专题集合
2010/08/19 PHP
thinkphp如何获取客户端IP
2015/11/03 PHP
简单实现PHP留言板功能
2016/12/21 PHP
强大的jquery插件jqeuryUI做网页对话框效果!简单
2011/04/14 Javascript
jQuery源码分析-01总体架构分析
2011/11/14 Javascript
自定义jQuery选项卡插件实例
2013/03/27 Javascript
js动态添加onclick事件可传参数与不传参数
2014/07/29 Javascript
js实现固定显示区域内自动缩放图片的方法
2015/07/18 Javascript
jQuery复制表单元素附源码分享效果演示
2015/09/30 Javascript
JavaScript中获取纯正的undefined的方法
2016/03/06 Javascript
利用JQuery实现datatables插件的增加和删除行功能
2017/01/06 Javascript
浅谈JavaScript中promise的使用
2017/01/11 Javascript
JavaScript实现选中文字提示新浪微博分享效果
2017/06/15 Javascript
简单实现js上传文件功能
2017/08/21 Javascript
jQuery判断网页是否已经滚动到浏览器底部的实现方法
2017/10/27 jQuery
ES6 javascript中class静态方法、属性与实例属性用法示例
2017/10/30 Javascript
C#实现将一个字符转换为整数
2017/12/12 Javascript
基于casperjs和resemble.js实现一个像素对比服务详解
2018/01/10 Javascript
详解Webpack-dev-server的proxy用法
2018/09/08 Javascript
webpack常用配置总览(小结)
2019/11/18 Javascript
js实现跳一跳小游戏
2020/07/31 Javascript
Python FTP操作类代码分享
2014/05/13 Python
Python实现telnet服务器的方法
2015/07/10 Python
Python 数据结构之堆栈实例代码
2017/01/22 Python
解决python打不开文件(文件不存在)的问题
2019/02/18 Python
为何人工智能(AI)首选Python?读完这篇文章你就知道了(推荐)
2019/04/06 Python
详解基于Jupyter notebooks采用sklearn库实现多元回归方程编程
2020/03/25 Python
css3图片边框border-image的用法
2017/06/30 HTML / CSS
什么是.net的Remoting技术
2016/07/08 面试题
大学毕业生个人自荐信范文
2014/01/08 职场文书
捐款倡议书格式范文
2014/05/14 职场文书
2014年幼儿园国庆主题活动方案
2014/09/16 职场文书
2014小学生国庆65周年演讲稿
2014/09/21 职场文书
汽车销售助理岗位职责
2015/04/14 职场文书
小学新课改心得体会
2016/01/22 职场文书
使用python绘制横竖条形图
2022/04/21 Python