python+selenium实现登录账户后自动点击的示例


Posted in Python onDecember 22, 2017

公司在codereview的时候限制了看代码的时间,实际上不少代码属于框架自动生成,并不需要花费太多时间看,为了达标,需要刷点时间(鼠标点击网页固定区域)。我想到可以利用自动化测试的手段完成这种无效的体力劳动。

首先,明确一下需求:

  1. 自动打开网页
  2. 登陆账号 
  3. 每隔一定时间点击一下固定区域

我想到的方案有两个,sikuli或者python+selenium。sikuli的优点是逻辑操作简单直接,使用图片作为标示,缺点是需要窗口固定,并且无法后台运行。selenium稍复杂一定,但是运行速度快,窗口可以遮挡。

这里简单记录一下使用Python+selenium的小例子。

使用的版本为Python3.3以及selenium2,Windows环境(现在已经支持3.0以上的了,多处论坛博客没有更新)。

首先是软件的安装,Python不赘述了,记得设置环境变量。

下面安装selenium,如果已经安装过pip。直接运行一下命令。

pip install -U selenium

另一种方式,https://pypi.python.org/packages/source/s/selenium/selenium-2.52.0.tar.gz下载并解压。这里简述一下windows版本,其实Unix下也差不多,使用Wget下载一下安装。

使用命令(setup一般用于第三方模块的安装):

cd c:\Python3\xxxx
python setup.py install

安装过程中可能会出现ImportError: No module named setuptools,这是因为缺少setuptools模块,Python默认不安装。

在http://pypi.python.org/pypi/setuptools上面提供了各系统的安装包和安装指南,对于Windows系统,下载https://bootstrap.pypa.io/ez_setup.py自动化安装脚本。

运行:

python ez_setup.py

完成后再安装selenium即可。

这里用我自己的实例简单的讲解一下流程。

第一步先完成打开浏览器。

selenium2结合了selenium和webdriver,直接引入各个浏览器相应的驱动,打开即可,注意chrome驱动可能需要另行安装。

from selenium import webdriver
browser = webdriver.Firefox()
browser.get('https://www.xxx.com')

打开网页后需要登录,F12打开浏览器调试器,小箭头选取元素,查看登录框账号和密码的属性,一般都有ID。selenium可以通过以下各个方法获取元素并进行各种操作,具体解释请看上方链接文档:

  1. find_element_by_id
  2. find_element_by_name
  3. find_element_by_xpath
  4. find_element_by_link_text
  5. find_element_by_partial_link_text
  6. find_element_by_tag_name
  7. find_element_by_class_name
  8. find_element_by_css_selector

其中id最为有效方便,优先考虑。选取完元素之后可以通过WebDriver API调用模拟键盘的输入和鼠标的点击操作。代码如下:

username="qun" 
passwd="passwd"
browser = webdriver.Firefox()
browser.get('https://www.xxx.com')
browser.implicitly_wait(10)
elem=browser.find_element_by_id("loginFormUserName")
elem.send_keys(username)
elem=browser.find_element_by_id("loginFormPassword")
elem.send_keys(passwd)
elem=browser.find_element_by_id("loginFormSubmit")
elem.click()

一般登录之后页面都会跳转到新的网页上,如何获取新的网页呢?这里有个窗口句柄的概念,通过切换窗口句柄来完成。注意!有时候元素在一个frame里面的时候,也需要通过swtich切换。这里出现一个wait函数(上面也有),是因为页面加载需要时间,很可能在点击之后元素才加载出来,下一节详细解释一下wait。

browser.implicitly_wait(10)
browser.switch_to_window(browser.window_handles[-1])

之后选取需要点击的区域,这里使用 xpath定位,因为在自动化测试的过程中,很有可能元素无法通过id,name等方法定位(不少人就是不写,爱table套table,我也么办法),xpath就有了用武之地。常用的偷懒方法是Firefox安装xpath插件,右键直接获取。这里不介绍,因为不提倡,使用插件会造成代码里充斥这样的东西:

XPath(/html/body/div/div[3]/div[2]/div[4]/p[2])

不到万不得已,尽可能使用元素的特征来定位,比如按钮的name。

或者通过父元素定位子元素。

username =browser.find_element_by_xpath("//input[@name='username']")
clear_button = browser.find_element_by_xpath("//form[@id='loginForm']/input[4]")

代码如下,网上经常出现的By的用法需要引入包。

from selenium.webdriver.common.by import By

这里使用另外一个函数,我不知道有什么区别- -。

for i in range(100):
  elem=WebDriverWait(browser, 30).until(
    lambda x:x.find_element_by_xpath("//table[@class='aaa']"/td[1]))
  elem.click()
  time.sleep(20)
  print ("click",i)

然后这里还要提一下wait函数,在selenium2中延迟等待分为两种,显示等待和隐式等待。  

显示等待

显式等待,就是明确的要等到某个元素的出现或者是某个元素的可点击等条件,等不到,就一直等,除非在规定的时间之内都没找到,那么就跳出Exception。

element = WebDriverWait(driver, 10).until(
    EC.presence_of_element_located((By.ID, "myDynamicElement"))
  )

隐式等待

注意,隐式等待是告诉设置所有dom元素在寻找某个元素的时候,如果没立即找到,再尝试这么长时间。

browser.implicitly_wait(10) # seconds

两者的区别在于一个是自己直接管理超时对象,一个是交给webdriver去做。

当然也可以用休眠的方法干等。记得引入time包。

time.sleep(20)

这里只是简单的演示一下用法,有许多可以改进的地方,没有封装函数,么有使用多线程并发执行多个例程。以后有需求再改进。

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
linux下安装easy_install的方法
Feb 10 Python
在Django的模型和公用函数中使用惰性翻译对象
Jul 27 Python
python爬虫框架scrapy实战之爬取京东商城进阶篇
Apr 24 Python
python的socket编程入门
Jan 29 Python
pandas DataFrame的修改方法(值、列、索引)
Aug 02 Python
Python 从subprocess运行的子进程中实时获取输出的例子
Aug 14 Python
浅谈keras 模型用于预测时的注意事项
Jun 27 Python
python 删除系统中的文件(按时间,大小,扩展名)
Nov 19 Python
Python应用自动化部署工具Fabric原理及使用解析
Nov 30 Python
Prometheus开发中间件Exporter过程详解
Nov 30 Python
使用Python通过oBIX协议访问Niagara数据的示例
Dec 04 Python
用python查找统一局域网下ip对应的mac地址
Jan 13 Python
python实现决策树
Dec 21 #Python
python利用sklearn包编写决策树源代码
Dec 21 #Python
python实现决策树分类算法
Dec 21 #Python
Python语言描述机器学习之Logistic回归算法
Dec 21 #Python
python Crypto模块的安装与使用方法
Dec 21 #Python
python编写Logistic逻辑回归
Dec 30 #Python
python+selenium识别验证码并登录的示例代码
Dec 21 #Python
You might like
通过table标签,PHP输出EXCEL的实现方法
2013/07/24 PHP
PHP中数组定义的几种方法
2013/09/01 PHP
PHP5.3与5.5废弃与过期函数整理汇总
2014/07/10 PHP
网站防止被刷票的一些思路与方法
2015/01/08 PHP
php实现专业获取网站SEO信息类实例
2015/04/02 PHP
php的PDO事务处理机制实例分析
2017/02/16 PHP
基于Laravel实现的用户动态模块开发
2017/09/21 PHP
PHP获取文件扩展名的常用方法小结【五种方式】
2018/04/27 PHP
Laravel 框架路由原理与路由访问实例分析
2020/04/14 PHP
jQuery之网页换肤实现代码
2011/04/30 Javascript
js鼠标滑轮滚动事件绑定的简单实例(兼容主流浏览器)
2014/01/14 Javascript
jquery图片轮播插件仿支付宝2013版全屏图片幻灯片
2014/04/03 Javascript
微信小程序开发之实现选项卡(窗口顶部TabBar)页面切换
2016/11/25 Javascript
利用jQuery.Validate异步验证用户名是否存在(推荐)
2016/12/09 Javascript
JavaScript实现瀑布流以及加载效果
2017/02/11 Javascript
如何选择jQuery版本 1.x? 2.x? 3.x?
2017/04/01 jQuery
Node.js中DNS模块学习总结
2018/02/28 Javascript
vue-cli脚手架config目录下index.js配置文件的方法
2018/03/13 Javascript
jQuery实现判断上传图片类型和大小的方法示例
2018/04/11 jQuery
Vue 按键修饰符处理事件的方法
2018/05/04 Javascript
js实现鼠标拖拽缩放div实例代码
2019/03/25 Javascript
Python之批量创建文件的实例讲解
2018/05/10 Python
python实现NB-IoT模块远程控制
2018/06/20 Python
对python的bytes类型数据split分割切片方法
2018/12/04 Python
Python使用sqlite3模块内置数据库
2020/05/07 Python
Python 忽略文件名编码的方法
2020/08/01 Python
Python unittest装饰器实现原理及代码
2020/09/08 Python
最新大学毕业求职简历的自我评价
2013/10/18 职场文书
代理商会议邀请函
2014/01/27 职场文书
中学教师教育感言
2014/02/21 职场文书
综治宣传月活动总结
2014/04/28 职场文书
大学生村官考核材料
2014/05/23 职场文书
小学数学课题方案
2014/06/15 职场文书
《和时间赛跑》读后感3篇
2019/12/16 职场文书
win10+anaconda安装yolov5的方法及问题解决方案
2021/04/29 Python
详解MongoDB的条件查询和排序
2021/06/23 MongoDB