编程 Python

Selenium+BeautifulSoup+json获取Script标签内的json数据

Posted in Python onDecember 07, 2020

Selenium爬虫遇到数据是以 JSON 字符串的形式包裹在 Script 标签中，

假设Script标签下代码如下：

<script id="DATA_INFO" type="application/json" >
{
  "user": {
    "isLogin": true,
    "userInfo": {
      "id": 123456,
      "nickname": "LiMing",
      "intro": "人生苦短，我用python"
    }
  }
}
</script>

此时drive.find_elements_by_xpath('//*[@id="DATA_INFO"] 只能定位到元素，但是无法通过.text方法，获取Script标签下的json数据

from bs4 import BeautifulSoup as bs
import json as js
#selenium获取当前页面源码
html = drive.page_source
#BeautifulSoup转换页面源码
bs=BeautifulSoup(html,'lxml')
#获取Script标签下的完整json数据，并通过json加载成字典格式
js_test=js.loads(bs.find("script",{"id":"DATA_INFO"}).get_text())
#获取Script标签下的nickname 值
js_tes

到此这篇关于Selenium+BeautifulSoup+json获取Script标签内的json数据的文章就介绍到这了,更多相关Selenium+BeautifulSoup获取json内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木！

Selenium+BeautifulSoup+json获取Script标签内的json数据

- Author -

诡途

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

Python入门教程之if语句的用法

May 14 Python

初步认识Python中的列表与位运算符

Oct 12 Python

Python标准库06之子进程 (subprocess包) 详解

Dec 07 Python

Python正则表达式经典入门教程

May 22 Python

Python使用random.shuffle()打乱列表顺序的方法

Nov 08 Python

使用Django连接Mysql数据库步骤

Jan 15 Python

python爬虫爬取微博评论案例详解

Mar 27 Python

python使用Plotly绘图工具绘制柱状图

Apr 01 Python

详解python模块pychartdir安装及导入问题

Oct 22 Python

python中scipy.stats产生随机数实例讲解

Feb 19 Python

Python实现单例模式的5种方法

Jun 15 Python

Python基础之条件语句详解

Jun 16 Python

Python爬虫实战案例之爬取喜马拉雅音频数据详解

Dec 07 #Python

用python对excel查重

Dec 07 #Python

python3 通过 pybind11 使用Eigen加速代码的步骤详解

Dec 07 #Python

python 通过 pybind11 使用Eigen加速代码的步骤

Dec 07 #Python

Python中BeautifulSoup通过查找Id获取元素信息

Dec 07 #Python

BeautifulSoup中find和find_all的使用详解

Dec 07 #Python

python爬虫beautifulsoup解析html方法

Dec 07 #Python

You might like

国内咖啡文化

2021/03/03 咖啡文化

PHP实现生成透明背景的PNG缩略图函数分享

2014/07/08 PHP

PHP速成大法

2015/01/30 PHP

select 控制网页内容隐藏于显示的实现代码

2010/05/25 Javascript

js Function类型

2011/12/04 Javascript

jquery分页插件jpaginate在IE中不兼容问题

2014/04/22 Javascript

javascript定时器完整实例

2015/02/10 Javascript

jQuery+formdata实现上传进度特效遇到的问题

2016/02/24 Javascript

基于javascript实现tab选项卡切换特效调试笔记

2016/03/30 Javascript

浅谈js script标签中的预解析

2016/12/30 Javascript

完美解决手机浏览器顶部下拉出现网页源或刷新的问题

2017/11/30 Javascript

在vue中安装使用vux的教程详解

2018/09/16 Javascript

利用vue-i18n实现多语言切换效果的方法

2019/06/19 Javascript

vue 集成 vis-network 实现网络拓扑图的方法

2019/08/07 Javascript

vue相同路由跳转强制刷新该路由组件操作

2020/08/05 Javascript

[01:28:56]2014 DOTA2华西杯精英邀请赛 5 24 CIS VS DK

2014/05/26 DOTA

用Python制作检测Linux运行信息的工具的教程

2015/04/01 Python

从Python程序中访问Java类的简单示例

2015/04/20 Python

Python文件右键找不到IDLE打开项解决办法

2015/06/08 Python

wxPython使用系统剪切板的方法

2015/06/16 Python

python实现将html表格转换成CSV文件的方法

2015/06/28 Python

Python使用xlrd实现读取合并单元格

2020/07/09 Python

Python3如何实现Win10桌面自动切换

2020/08/11 Python

利用html5 file api读取本地文件示例(如图片、PDF等)

2018/03/07 HTML / CSS

美国从事品牌鞋类零售的连锁店：Famous Footwear

2016/08/25 全球购物

Smashbox官网：美国知名彩妆品牌

2017/01/05 全球购物

马来西亚最好的婴儿商店：Motherhood

2017/09/14 全球购物

文秘专业毕业生就业推荐信

2013/11/08 职场文书

幼儿教师思想汇报

2014/01/10 职场文书

教师对学生的评语

2014/04/28 职场文书

乡镇干部先进性教育活动个人整改措施

2014/09/16 职场文书

大学生求职自荐信

2015/03/24 职场文书

工程催款通知书

2015/04/17 职场文书

毕业生学校组织意见

2015/06/04 职场文书

新教师教学工作总结

2015/08/12 职场文书

python lambda 表达式形式分析

2022/04/03 Python