Python Selenium自动化获取页面信息的方法


Posted in Python onAugust 31, 2020

1.获取页面title

title:获取当前页面的标题显示的字段

from selenium import webdriver
import time 

browser = webdriver.Chrome()
browser.get('https://www.baidu.com') 

#打印网页标题
print(browser.title)
#输出内容:百度一下,你就知道

2.获取页面URL

current_url:获取当前页面的URL

from selenium import webdriver
import time 

browser = webdriver.Chrome()
browser.get('https://www.baidu.com') 

#打印网页标题
print(browser.current_url)
#输出内容:https://www.baidu.com/

3.获取浏览器版本号

capabilities['version']):打印浏览器version的值

from selenium import webdriver
import time 

browser = webdriver.Chrome()
browser.get('https://www.baidu.com') 

#打印网页标题
print(browser.capabilities['version'])
#输出内容:67.0.3396.87

4.获取元素尺寸

size:返回元素的尺寸

from selenium import webdriver
import time 

browser = webdriver.Chrome()
browser.get('https://www.baidu.com') 

#定位输入框
input_box = browser.find_element_by_id('kw')
#打印输入框尺寸
print(input_box.size)
#输出内容:{'height': 22, 'width': 500}

5.获取元素的文本

text:返回元素的文本信息

from selenium import webdriver
import time 

browser = webdriver.Chrome()
browser.get('https://www.baidu.com') 

#定位备案元素
recordcode = browser.find_element_by_id('jgwab')
#打印备案元素信息
print(recordcode.text)
#输出内容:京公网安备11000002000001号

6.获得属性值

  • get_attribute('')方法
  • get_attribute('href'):获取href属性值
  • get_attribute('id'):获取id属性值
# coding=utf-8
import time
from selenium import webdriver


driver = webdriver.Chrome()
driver.maximize_window()
driver.implicitly_wait(6)
driver.get("https://www.baidu.com")
time.sleep(1)

for link in driver.find_elements_by_xpath("//*[@href]"):
  print (link.get_attribute('href'))
driver.quit()

到此这篇关于Python Selenium自动化获取页面信息的方法的文章就介绍到这了,更多相关Python Selenium 获取页面信息内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
linux 下实现python多版本安装实践
Nov 18 Python
分析Python编程时利用wxPython来支持多线程的方法
Apr 07 Python
Python统计纯文本文件中英文单词出现个数的方法总结【测试可用】
Jul 25 Python
实例详解Matlab 与 Python 的区别
Apr 26 Python
pyqt5 实现多窗口跳转的方法
Jun 19 Python
Python3网络爬虫开发实战之极验滑动验证码的识别
Aug 02 Python
python对常见数据类型的遍历解析
Aug 27 Python
Django发送邮件功能实例详解
Sep 02 Python
Django之使用celery和NGINX生成静态页面实现性能优化
Oct 08 Python
PyQt5 如何让界面和逻辑分离的方法
Mar 24 Python
python使用Thread的setDaemon启动后台线程教程
Apr 25 Python
python Matplotlib基础--如何添加文本和标注
Jan 26 Python
python+requests接口自动化框架的实现
Aug 31 #Python
python如何导出微信公众号文章方法详解
Aug 31 #Python
Python生成并下载文件后端代码实例
Aug 31 #Python
python exit出错原因整理
Aug 31 #Python
Python如何将模块打包并发布
Aug 30 #Python
如何以Winsows Service方式运行JupyterLab
Aug 30 #Python
selenium切换标签页解决get超时问题的完整代码
Aug 30 #Python
You might like
中国广播史趣谈 — 几个历史第一次
2021/03/01 无线电
php 记录进行累加并显示总时长为秒的结果
2011/11/04 PHP
PHP采集腾讯微博的实现代码
2012/01/19 PHP
php使用Image Magick将PDF文件转换为JPG文件的方法
2015/04/01 PHP
PHP入门教程之字符串处理技巧总结(转换,过滤,解析,查找,截取,替换等)
2016/09/11 PHP
Laravel框架实现的上传图片到七牛功能详解
2019/09/06 PHP
javascript 表单验证常见正则
2009/09/28 Javascript
为什么要在引入的css或者js文件后面加参数的详细讲解
2013/05/03 Javascript
JavaScript获取一个范围内日期的方法
2015/04/24 Javascript
asp.net中oracle 存储过程(图文)
2015/08/12 Javascript
js智能获取浏览器版本UA信息的方法
2016/08/08 Javascript
Js获取当前日期时间及格式化代码
2016/09/17 Javascript
angular.js之路由的选择方法
2016/09/24 Javascript
JS常见疑难点分析之match,charAt,charCodeAt,map,search用法分析
2016/12/25 Javascript
Vue 中mixin 的用法详解
2018/04/23 Javascript
vue-for循环嵌套操作示例
2019/01/28 Javascript
jQuery实现为table表格动态添加或删除tr功能示例
2019/02/19 jQuery
通过实例解析json与jsonp原理及使用方法
2020/09/27 Javascript
python中根据字符串调用函数的实现方法
2016/06/12 Python
python编程嵌套函数实例代码
2018/02/11 Python
Python实现正整数分解质因数操作示例
2018/08/01 Python
计算机二级python学习教程(2) python语言基本语法元素
2019/05/16 Python
python 实现屏幕录制示例
2019/12/23 Python
解决Jupyter因卸载重装导致的问题修复
2020/04/10 Python
Python爬虫:Request Payload和Form Data的简单区别说明
2020/04/30 Python
利用Storage Event实现页面间通信的示例代码
2018/07/26 HTML / CSS
护理专业的自荐信
2013/10/22 职场文书
家长写给老师的建议书
2014/03/13 职场文书
网络技术专业求职信
2014/05/02 职场文书
学校读书活动总结
2014/06/30 职场文书
委托证明范本
2014/11/25 职场文书
爱的教育观后感
2015/06/17 职场文书
五一晚会主持词
2015/07/01 职场文书
导游词之鲁迅祖居
2019/10/17 职场文书
据Python爬虫不靠谱预测可知今年双十一销售额将超过6000亿元
2021/11/11 Python
MySQL数据库 任意ip连接方法
2022/05/20 MySQL