Selenium+BeautifulSoup+json获取Script标签内的json数据


Posted in Python onDecember 07, 2020

Selenium爬虫遇到 数据是以 JSON 字符串的形式包裹在 Script 标签中,

假设Script标签下代码如下:

<script id="DATA_INFO" type="application/json" >
{
  "user": {
    "isLogin": true,
    "userInfo": {
      "id": 123456,
      "nickname": "LiMing",
      "intro": "人生苦短,我用python"
    }
  }
}
</script>

此时drive.find_elements_by_xpath('//*[@id="DATA_INFO"] 只能定位到元素,但是无法通过.text方法,获取Script标签下的json数据

from bs4 import BeautifulSoup as bs
import json as js
#selenium获取当前页面源码
html = drive.page_source
#BeautifulSoup转换页面源码
bs=BeautifulSoup(html,'lxml')
#获取Script标签下的完整json数据,并通过json加载成字典格式
js_test=js.loads(bs.find("script",{"id":"DATA_INFO"}).get_text())
#获取Script标签下的nickname 值
js_tes

到此这篇关于Selenium+BeautifulSoup+json获取Script标签内的json数据的文章就介绍到这了,更多相关Selenium+BeautifulSoup获取json内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
使用Python的Django框架实现事务交易管理的教程
Apr 20 Python
使用pdb模块调试Python程序实例
Jun 02 Python
Python中的左斜杠、右斜杠(正斜杠和反斜杠)
Aug 30 Python
Python中的命令行参数解析工具之docopt详解
Mar 27 Python
Python实现的多线程同步与互斥锁功能示例
Nov 30 Python
python控制windows剪贴板,向剪贴板中写入图片的实例
May 31 Python
对python 数据处理中的LabelEncoder 和 OneHotEncoder详解
Jul 11 Python
Python实现FTP文件传输的实例
Jul 07 Python
django mysql数据库及图片上传接口详解
Jul 18 Python
python def 定义函数,调用函数方式
Jun 02 Python
python3代码中实现加法重载的实例
Dec 03 Python
Python函数式编程中itertools模块详解
Sep 15 Python
Python爬虫实战案例之爬取喜马拉雅音频数据详解
Dec 07 #Python
用python对excel查重
Dec 07 #Python
python3 通过 pybind11 使用Eigen加速代码的步骤详解
Dec 07 #Python
python 通过 pybind11 使用Eigen加速代码的步骤
Dec 07 #Python
Python中BeautifulSoup通过查找Id获取元素信息
Dec 07 #Python
BeautifulSoup中find和find_all的使用详解
Dec 07 #Python
python爬虫beautifulsoup解析html方法
Dec 07 #Python
You might like
PHP三层结构(上) 简单三层结构
2010/07/04 PHP
10条PHP高级技巧[修正版]
2011/08/02 PHP
php+ajax实现无刷新动态加载数据技术
2015/04/28 PHP
盘点PHP和ASP.NET的10大对比!
2015/12/24 PHP
php实现异步将远程链接上内容(图片或内容)写到本地的方法
2016/11/30 PHP
JQuery 入门实例1
2009/06/25 Javascript
检测一个函数是否是JavaScript原生函数的小技巧
2015/03/13 Javascript
基于jquery实现图片上传本地预览功能
2016/01/08 Javascript
jQuery实现点击按钮文字变成input框点击保存变成文字
2016/05/09 Javascript
js+html5实现canvas绘制椭圆形图案的方法
2016/05/21 Javascript
WEB前端实现裁剪上传图片功能
2016/10/17 Javascript
微信小程序 wxapp地图 map详解
2016/10/31 Javascript
Angular页面间切换及传值的4种方法
2016/11/04 Javascript
jQuery Validate格式验证功能实例代码(包括重名验证)
2017/07/18 jQuery
jQuery获取所有父级元素及同级元素及子元素的方法(推荐)
2018/01/21 jQuery
node.js博客项目开发手记
2018/03/16 Javascript
jQuery点击页面其他部分隐藏下拉菜单功能
2018/11/27 jQuery
layui当点击文本框时弹出选择框,显示选择内容的例子
2019/09/02 Javascript
通过实例解析vuejs如何实现调试代码
2020/07/16 Javascript
Python struct模块解析
2014/06/12 Python
详解Python中的Descriptor描述符类
2016/06/14 Python
python解析基于xml格式的日志文件
2017/02/25 Python
Python优先队列实现方法示例
2017/09/21 Python
python学习教程之使用py2exe打包
2017/09/24 Python
python实现黑客字幕雨效果
2018/06/21 Python
Python 将Matrix、Dict保存到文件的方法
2018/10/30 Python
python实现广度优先搜索过程解析
2019/10/19 Python
什么是Python中的顺序表
2020/06/02 Python
Pycharm创建文件时自动生成文件头注释(自定义设置作者日期)
2020/11/24 Python
德国网上超市:myTime.de
2019/08/26 全球购物
夜大毕业自我鉴定
2013/10/11 职场文书
平面设计师工作职责范文
2013/12/03 职场文书
如何打造一封优秀的留学推荐信
2014/01/25 职场文书
个人事迹材料怎么写
2014/12/30 职场文书
学生会招新宣传语
2015/07/13 职场文书
自愿离婚协议书范本2016
2016/03/18 职场文书