Selenium浏览器自动化如何上传文件


Posted in Python onApril 06, 2022

Selenium 封装了现成的文件上传操作。但是随着现代前端框架的发展,文件上传的方式越来越多样。而有一些文件上传的控件,要做自动化控制会更复杂一些,这篇文章主要讨论在复杂情况下,如何通过自动化完成文件上传。

1. input 元素上传文件

如果页面需要文件上传,那么在大多数情况下,都能在页面源代码中找到一个input的元素。

<input type="file" name="file_name">

如果能直接在页面当中看到这个input元素,那么通过 selenium 的 send_keys 方法就能完成文件的上传,在参数中传入本地文件的路径。

driver.get('<https://testpages.herokuapp.com/styled/file-upload-test.html>')

el = driver.find_element('id', "fileinput")
el.send_keys('/path/of/file.png')

2. input 元素隐藏

通过修改元素属性,把隐藏的元素属性改掉。

el = driver.find_element('xpath', '//input[@type="file"]')
driver.execute_script('arguments[0].style.visibility=\\'visible\\'', el)
el.send_keys(r'C:\\Users\\muji\\Desktop\\avatar.png')

比如可以通过这种方式实现百度的以图搜图。

driver.get('<http://www.baidu.com>')
driver.find_element('css selector', '.soutu-btn').click()
time.sleep(3)
el = driver.find_element('xpath', '//input[@type="file"]')
driver.execute_script('arguments[0].style.visibility=\\'visible\\'', el)
el.send_keys(r'C:\\Users\\muji\\Desktop\\avatar.png')

3. 文件选择对话框

对于有一些元素,直接通过 selenium 自带的 send_keys 方法上传文件并不会成功。如果不想对input元素进行过多的分析,那么比较直接的方式是采用文件上传对话框来处理。

一般来说,如果需要上传文件,那么当你点击这个元素之后,会出现一个文件上传的对话框,要求你选择文件,并点击确定。这个对话框是属于系统的,因此selenium 无法直接控制它。我们可以采用系统的自动化工具或者直接调用键盘来操作这种对话框。

在操作对话框之前,首先我们通过 selenium 点击文件上传的元素。

el = driver.find_element('id', "fileinput")
ActionChains(driver).click(el).perform()

input 元素并不能点击,所以不能用元素的 el.click() 方法,需要使用 ActionChains 下面的 click 方法。他们之间的区别在于元素的 el.click 方法更加严格,会对元素是否可见,是否可点击进行检测,在点击事件完全生效后,再执行下面的操作,如果不满足这些条件,可能会报错。 而 Action 下的 click 方法则粗暴得多,它几乎不对对元素进行检测,直接把鼠标移动到元素上方,执行点击操作,至于点击是否生效,根本不管。

4. 使用 pywinauto 上传文件

pywinauto 是Windows系统下的一个自动化工具,它可以直接获取到Windows系统下面的弹框,因此当文件上传的窗口出现之后,我们可以使用这个工具传入文件的路径,然后点击打开按钮。

from pywinauto import Desktop

app = Desktop()
dialog = app['打开']  # 根据名字找到弹出窗口
dialog["Edit"].type_keys('/path/of/file.md')  # 在输入框中输入值
dialog["Button"].click()

另一种系统自动化工具叫做 pyautogui。这个工具最大的特点在于使用坐标系统定位元素,可以轻而易举的做到跨平台。不管你是Windows,mac还是Linux,都可以使用这款工具实现自动化。

但是这款工具目前不支持中文的输入,因此我们需要借助剪切板来实现中输入。首先我们把对应的中文复制到剪切板当中,然后再通过 ctrl + v 热键粘贴到文件路径输入框当中。

5. pyautogui

import pyperclip

 pyperclip.copy('D:\\\\用户.html')
 pyautogui.hotkey('ctrl', 'v')
 pyautogui.press('enter', presses=2)

键盘

keyboard.write('C:\\\\Users\\\\muji\\\\Desktop\\\\avatar.png')
time.sleep(1)
keyboard.press('enter')

注意:百度以图搜图禁用了爬虫,所以在上传文件时会提示「图片上传失败,请重新上传」。

6. 并发问题

通过系统窗口上传文件简单粗暴,但是当你的程序需要并发执行时,使用这种方式实现文件上传就比较麻烦了。如果你的程序需要并发执行,最好还是通过控制input元素,使用 send_keys 方法实现文件上传。

到此这篇关于Selenium浏览器自动化如何上传文件的文章就介绍到这了,更多相关Selenium浏览器自动化上传文件内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
Python logging模块学习笔记
May 24 Python
Python生成随机密码
Mar 10 Python
python中字符串数组逆序排列方法总结
Jun 23 Python
Python绘图Matplotlib之坐标轴及刻度总结
Jun 28 Python
python自带tkinter库实现棋盘覆盖图形界面
Jul 17 Python
python快速编写单行注释多行注释的方法
Jul 31 Python
python3.7 openpyxl 删除指定一列或者一行的代码
Oct 08 Python
Django获取model中的字段名和字段的verbose_name方式
May 19 Python
浅谈keras 模型用于预测时的注意事项
Jun 27 Python
基于python实现可视化生成二维码工具
Jul 08 Python
Django CBV模型源码运行流程详解
Aug 17 Python
python获得命令行输入的参数的两种方式
Nov 02 Python
在Python 中将类对象序列化为JSON
Apr 06 #Python
Python中itertools库的四个函数介绍
Apr 06 #Python
如何用六步教会你使用python爬虫爬取数据
基于Python实现射击小游戏的制作
python使用opencv对图像添加噪声(高斯/椒盐/泊松/斑点)
python DataFrame中stack()方法、unstack()方法和pivot()方法浅析
浅谈Python中对象是如何被调用的
Apr 06 #Python
You might like
一个ORACLE分页程序,挺实用的.
2006/10/09 PHP
几个php应用技巧
2008/03/27 PHP
PHP之数组学习
2011/05/29 PHP
php开发过程中关于继承的使用方法分享
2011/06/17 PHP
PHP获取mysql数据表的字段名称和详细信息的方法
2014/09/27 PHP
通过JAVAScript实现页面自适应
2007/01/19 Javascript
js函数使用技巧之 setTimeout(function(){},0)
2009/02/09 Javascript
jQuery 使用手册(五)
2009/09/23 Javascript
JQuery 常用操作代码
2010/03/14 Javascript
JS Jquery 遍历,筛选页面元素 自动完成(实现代码)
2013/07/08 Javascript
js 动态加载事件的几种方法总结
2013/12/25 Javascript
解决js中window.open弹出的是上次的缓存页面问题
2013/12/29 Javascript
javascript 通用loading动画效果实例代码
2014/01/14 Javascript
基于jQuery实现的仿百度首页滑动选项卡效果代码
2015/11/16 Javascript
把json格式的字符串转换成javascript对象或数组的方法总结
2016/11/03 Javascript
利用vue开发一个所谓的数独方法实例
2017/12/21 Javascript
浅谈Node.js 中间件模式
2018/06/12 Javascript
在vue中安装使用vux的教程详解
2018/09/16 Javascript
vue实现短信验证码输入框
2020/04/17 Javascript
python 参数列表中的self 显式不等于冗余
2008/12/01 Python
Python获取当前时间的方法
2014/01/14 Python
Python内建函数之raw_input()与input()代码解析
2017/10/26 Python
python 列表推导式使用详解
2019/08/29 Python
Python利用FFT进行简单滤波的实现
2020/02/26 Python
python实现人脸签到系统
2020/04/13 Python
keras输出预测值和真实值方式
2020/06/27 Python
python中doctest库实例用法
2020/12/31 Python
让ie浏览器成为支持html5的浏览器的解决方法(使用html5shiv)
2014/04/08 HTML / CSS
html5视频媒体标签video的使用方法及完整参数说明详解
2019/09/27 HTML / CSS
Amara德国:家居饰品、设计师品牌和豪华礼品
2019/05/20 全球购物
意大利在线眼镜精品店:Ottica Lipari
2019/11/11 全球购物
计算机专业自荐信
2013/10/14 职场文书
2015年幼儿园教育教学工作总结
2015/05/25 职场文书
2016年基层党组织公开承诺书
2016/03/25 职场文书
python之PySide2安装使用及QT Designer UI设计案例教程
2021/07/26 Python
redis protocol通信协议及使用详解
2022/07/15 Redis