Python Selenium自动化获取页面信息的方法


Posted in Python onAugust 31, 2020

1.获取页面title

title:获取当前页面的标题显示的字段

from selenium import webdriver
import time 

browser = webdriver.Chrome()
browser.get('https://www.baidu.com') 

#打印网页标题
print(browser.title)
#输出内容:百度一下,你就知道

2.获取页面URL

current_url:获取当前页面的URL

from selenium import webdriver
import time 

browser = webdriver.Chrome()
browser.get('https://www.baidu.com') 

#打印网页标题
print(browser.current_url)
#输出内容:https://www.baidu.com/

3.获取浏览器版本号

capabilities['version']):打印浏览器version的值

from selenium import webdriver
import time 

browser = webdriver.Chrome()
browser.get('https://www.baidu.com') 

#打印网页标题
print(browser.capabilities['version'])
#输出内容:67.0.3396.87

4.获取元素尺寸

size:返回元素的尺寸

from selenium import webdriver
import time 

browser = webdriver.Chrome()
browser.get('https://www.baidu.com') 

#定位输入框
input_box = browser.find_element_by_id('kw')
#打印输入框尺寸
print(input_box.size)
#输出内容:{'height': 22, 'width': 500}

5.获取元素的文本

text:返回元素的文本信息

from selenium import webdriver
import time 

browser = webdriver.Chrome()
browser.get('https://www.baidu.com') 

#定位备案元素
recordcode = browser.find_element_by_id('jgwab')
#打印备案元素信息
print(recordcode.text)
#输出内容:京公网安备11000002000001号

6.获得属性值

  • get_attribute('')方法
  • get_attribute('href'):获取href属性值
  • get_attribute('id'):获取id属性值
# coding=utf-8
import time
from selenium import webdriver


driver = webdriver.Chrome()
driver.maximize_window()
driver.implicitly_wait(6)
driver.get("https://www.baidu.com")
time.sleep(1)

for link in driver.find_elements_by_xpath("//*[@href]"):
  print (link.get_attribute('href'))
driver.quit()

到此这篇关于Python Selenium自动化获取页面信息的方法的文章就介绍到这了,更多相关Python Selenium 获取页面信息内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
跟老齐学Python之Import 模块
Oct 13 Python
用Python给文本创立向量空间模型的教程
Apr 23 Python
Python基于pygame实现的弹力球效果(附源码)
Nov 11 Python
Python实现图片转字符画的示例代码
Aug 21 Python
Django框架的使用教程路由请求响应的方法
Jul 03 Python
python3.x实现base64加密和解密
Mar 28 Python
Kali Linux安装ipython2 和 ipython3的方法
Jul 11 Python
django+echart数据动态显示的例子
Aug 12 Python
使用Python生成200个激活码的实现方法
Nov 22 Python
TensorFlow命名空间和TensorBoard图节点实例
Jan 23 Python
pycharm 如何取消连按两下shift出现的全局搜索
Jan 15 Python
Python中X[:,0]和X[:,1]的用法
May 10 Python
python+requests接口自动化框架的实现
Aug 31 #Python
python如何导出微信公众号文章方法详解
Aug 31 #Python
Python生成并下载文件后端代码实例
Aug 31 #Python
python exit出错原因整理
Aug 31 #Python
Python如何将模块打包并发布
Aug 30 #Python
如何以Winsows Service方式运行JupyterLab
Aug 30 #Python
selenium切换标签页解决get超时问题的完整代码
Aug 30 #Python
You might like
咖啡知识 咖啡养豆要养多久 排气又是什么
2021/03/06 新手入门
PHPwind整合最土系统用户同步登录实现方法
2010/12/08 PHP
PHP 设计模式之观察者模式介绍
2012/02/22 PHP
使用PHP实现下载CSS文件中的图片
2015/12/06 PHP
PHP实现根据数组某个键值大小进行排序的方法
2018/03/13 PHP
php实现构建排除当前元素的乘积数组方法
2018/10/06 PHP
PHP设计模式入门之状态模式原理与实现方法分析
2020/04/26 PHP
javascript 常用关键字列表集合
2007/12/04 Javascript
javascript面向对象编程代码
2011/12/19 Javascript
jquery动态调整div大小使其宽度始终为浏览器宽度
2014/06/06 Javascript
Node.js中使用事件发射器模式实现事件绑定详解
2014/08/15 Javascript
解析NodeJS异步I/O的实现
2017/04/13 NodeJs
JS实现页面打印(整体、局部)
2017/08/18 Javascript
Vue2.0结合webuploader实现文件分片上传功能
2018/03/09 Javascript
vue自定义指令的创建和使用方法实例分析
2018/12/04 Javascript
javascript判断一个变量是数组还是对象
2019/04/10 Javascript
node.js中 mysql 增删改查操作及async,await处理实例分析
2020/02/11 Javascript
JavaScript中的this基本问题实例小结
2020/03/09 Javascript
vue商城中商品“筛选器”功能的实现代码
2020/07/01 Javascript
[07:31]DOTA2卡尔工作室 英雄介绍主宰篇
2013/06/25 DOTA
[49:54]Ti4 循环赛第三日 LGD vs Titan
2014/07/12 DOTA
在Python中通过threading模块定义和调用线程的方法
2016/07/12 Python
利用Python将每日一句定时推送至微信的实现方法
2018/08/13 Python
python字典的setdefault的巧妙用法
2019/08/07 Python
Python字符编码转码之GBK,UTF8互转
2020/02/09 Python
移动端html5判断是否滚动到底部并且下拉加载
2019/11/19 HTML / CSS
亚洲领先的设计购物网站:Pinkoi
2020/11/26 全球购物
计算机求职信
2013/12/01 职场文书
关于打架的检讨书
2014/01/17 职场文书
企业安全标语
2014/06/07 职场文书
机电一体化专业毕业生自荐信
2014/06/19 职场文书
英语系本科生求职信
2014/07/15 职场文书
个人四风问题对照检查材料
2014/09/26 职场文书
大学感恩节活动策划方案
2014/10/11 职场文书
Python如何导出导入所有依赖包详解
2021/06/08 Python
MySQL慢查询优化解决问题
2022/03/17 MySQL