Selenium+BeautifulSoup+json获取Script标签内的json数据


Posted in Python onDecember 07, 2020

Selenium爬虫遇到 数据是以 JSON 字符串的形式包裹在 Script 标签中,

假设Script标签下代码如下:

<script id="DATA_INFO" type="application/json" >
{
  "user": {
    "isLogin": true,
    "userInfo": {
      "id": 123456,
      "nickname": "LiMing",
      "intro": "人生苦短,我用python"
    }
  }
}
</script>

此时drive.find_elements_by_xpath('//*[@id="DATA_INFO"] 只能定位到元素,但是无法通过.text方法,获取Script标签下的json数据

from bs4 import BeautifulSoup as bs
import json as js
#selenium获取当前页面源码
html = drive.page_source
#BeautifulSoup转换页面源码
bs=BeautifulSoup(html,'lxml')
#获取Script标签下的完整json数据,并通过json加载成字典格式
js_test=js.loads(bs.find("script",{"id":"DATA_INFO"}).get_text())
#获取Script标签下的nickname 值
js_tes

到此这篇关于Selenium+BeautifulSoup+json获取Script标签内的json数据的文章就介绍到这了,更多相关Selenium+BeautifulSoup获取json内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
Python入门教程之if语句的用法
May 14 Python
初步认识Python中的列表与位运算符
Oct 12 Python
Python标准库06之子进程 (subprocess包) 详解
Dec 07 Python
Python正则表达式经典入门教程
May 22 Python
Python使用random.shuffle()打乱列表顺序的方法
Nov 08 Python
使用Django连接Mysql数据库步骤
Jan 15 Python
python爬虫爬取微博评论案例详解
Mar 27 Python
python使用Plotly绘图工具绘制柱状图
Apr 01 Python
详解python模块pychartdir安装及导入问题
Oct 22 Python
python中scipy.stats产生随机数实例讲解
Feb 19 Python
Python实现单例模式的5种方法
Jun 15 Python
Python基础之条件语句详解
Jun 16 Python
Python爬虫实战案例之爬取喜马拉雅音频数据详解
Dec 07 #Python
用python对excel查重
Dec 07 #Python
python3 通过 pybind11 使用Eigen加速代码的步骤详解
Dec 07 #Python
python 通过 pybind11 使用Eigen加速代码的步骤
Dec 07 #Python
Python中BeautifulSoup通过查找Id获取元素信息
Dec 07 #Python
BeautifulSoup中find和find_all的使用详解
Dec 07 #Python
python爬虫beautifulsoup解析html方法
Dec 07 #Python
You might like
国内咖啡文化
2021/03/03 咖啡文化
PHP实现生成透明背景的PNG缩略图函数分享
2014/07/08 PHP
PHP速成大法
2015/01/30 PHP
select 控制网页内容隐藏于显示的实现代码
2010/05/25 Javascript
js Function类型
2011/12/04 Javascript
jquery分页插件jpaginate在IE中不兼容问题
2014/04/22 Javascript
javascript定时器完整实例
2015/02/10 Javascript
jQuery+formdata实现上传进度特效遇到的问题
2016/02/24 Javascript
基于javascript实现tab选项卡切换特效调试笔记
2016/03/30 Javascript
浅谈js script标签中的预解析
2016/12/30 Javascript
完美解决手机浏览器顶部下拉出现网页源或刷新的问题
2017/11/30 Javascript
在vue中安装使用vux的教程详解
2018/09/16 Javascript
利用vue-i18n实现多语言切换效果的方法
2019/06/19 Javascript
vue 集成 vis-network 实现网络拓扑图的方法
2019/08/07 Javascript
vue相同路由跳转强制刷新该路由组件操作
2020/08/05 Javascript
[01:28:56]2014 DOTA2华西杯精英邀请赛 5 24 CIS VS DK
2014/05/26 DOTA
用Python制作检测Linux运行信息的工具的教程
2015/04/01 Python
从Python程序中访问Java类的简单示例
2015/04/20 Python
Python文件右键找不到IDLE打开项解决办法
2015/06/08 Python
wxPython使用系统剪切板的方法
2015/06/16 Python
python实现将html表格转换成CSV文件的方法
2015/06/28 Python
Python使用xlrd实现读取合并单元格
2020/07/09 Python
Python3如何实现Win10桌面自动切换
2020/08/11 Python
利用html5 file api读取本地文件示例(如图片、PDF等)
2018/03/07 HTML / CSS
美国从事品牌鞋类零售的连锁店:Famous Footwear
2016/08/25 全球购物
Smashbox官网:美国知名彩妆品牌
2017/01/05 全球购物
马来西亚最好的婴儿商店:Motherhood
2017/09/14 全球购物
文秘专业毕业生就业推荐信
2013/11/08 职场文书
幼儿教师思想汇报
2014/01/10 职场文书
教师对学生的评语
2014/04/28 职场文书
乡镇干部先进性教育活动个人整改措施
2014/09/16 职场文书
大学生求职自荐信
2015/03/24 职场文书
工程催款通知书
2015/04/17 职场文书
毕业生学校组织意见
2015/06/04 职场文书
新教师教学工作总结
2015/08/12 职场文书
python lambda 表达式形式分析
2022/04/03 Python