Selenium+BeautifulSoup+json获取Script标签内的json数据


Posted in Python onDecember 07, 2020

Selenium爬虫遇到 数据是以 JSON 字符串的形式包裹在 Script 标签中,

假设Script标签下代码如下:

<script id="DATA_INFO" type="application/json" >
{
  "user": {
    "isLogin": true,
    "userInfo": {
      "id": 123456,
      "nickname": "LiMing",
      "intro": "人生苦短,我用python"
    }
  }
}
</script>

此时drive.find_elements_by_xpath('//*[@id="DATA_INFO"] 只能定位到元素,但是无法通过.text方法,获取Script标签下的json数据

from bs4 import BeautifulSoup as bs
import json as js
#selenium获取当前页面源码
html = drive.page_source
#BeautifulSoup转换页面源码
bs=BeautifulSoup(html,'lxml')
#获取Script标签下的完整json数据,并通过json加载成字典格式
js_test=js.loads(bs.find("script",{"id":"DATA_INFO"}).get_text())
#获取Script标签下的nickname 值
js_tes

到此这篇关于Selenium+BeautifulSoup+json获取Script标签内的json数据的文章就介绍到这了,更多相关Selenium+BeautifulSoup获取json内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
Python简单格式化时间的方法【strftime函数】
Sep 18 Python
分享一个简单的python读写文件脚本
Nov 25 Python
python psutil库安装教程
Mar 19 Python
Ubuntu下使用Python实现游戏制作中的切分图片功能
Mar 30 Python
python 脚本生成随机 字母 + 数字密码功能
May 26 Python
Python 使用PIL中的resize进行缩放的实例讲解
Aug 03 Python
Python判断对象是否相等及eq函数的讲解
Feb 25 Python
Pyqt5 基本界面组件之inputDialog的使用
Jun 25 Python
pandas 如何分割字符的实现方法
Jul 29 Python
通过celery异步处理一个查询任务的完整代码
Nov 19 Python
从pandas一个单元格的字符串中提取字符串方式
Dec 17 Python
执行Python程序时模块报错问题
Mar 26 Python
Python爬虫实战案例之爬取喜马拉雅音频数据详解
Dec 07 #Python
用python对excel查重
Dec 07 #Python
python3 通过 pybind11 使用Eigen加速代码的步骤详解
Dec 07 #Python
python 通过 pybind11 使用Eigen加速代码的步骤
Dec 07 #Python
Python中BeautifulSoup通过查找Id获取元素信息
Dec 07 #Python
BeautifulSoup中find和find_all的使用详解
Dec 07 #Python
python爬虫beautifulsoup解析html方法
Dec 07 #Python
You might like
PHP与已存在的Java应用程序集成
2006/10/09 PHP
简单的页面缓冲技术
2006/10/09 PHP
PHP 文件扩展名 获取函数
2009/06/03 PHP
php中长文章分页显示实现代码
2012/09/29 PHP
PHP设计模式之结构模式的深入解析
2013/06/13 PHP
PHP入门经历和学习过程分享
2014/04/11 PHP
php阳历转农历优化版
2016/08/08 PHP
浅谈PHP面向对象之访问者模式+组合模式
2017/05/22 PHP
CI框架网页缓存简单用法分析
2018/12/26 PHP
js post方式传递提交的实现代码
2010/05/31 Javascript
广泛收集的jQuery拖放插件集合
2012/04/09 Javascript
jquery方法+js一般方法+js面向对象方法实现拖拽效果
2012/08/30 Javascript
javascript中全局对象的isNaN()方法使用介绍
2013/12/19 Javascript
使用 JavaScript 进行函数式编程 (一) 翻译
2015/10/02 Javascript
详解JavaScript的回调函数
2015/11/20 Javascript
Node.js与Sails redis组件的使用教程
2017/02/14 Javascript
微信小程序 登录的简单实现
2017/04/19 Javascript
windows下vue-cli及webpack搭建安装环境
2017/04/25 Javascript
JavaScript算法教程之sku(库存量单位)详解
2017/06/29 Javascript
js制作简单的音乐播放器的示例代码
2017/08/28 Javascript
微信小程序实现定位及到指定位置导航的示例代码
2019/08/20 Javascript
NodeJS开发人员常见五个错误理解
2020/10/14 NodeJs
JS指定音频audio在某个时间点进行播放
2020/11/28 Javascript
python转换摩斯密码示例
2014/02/16 Python
python函数局部变量用法实例分析
2015/08/04 Python
Python 比较两个数组的元素的异同方法
2017/08/17 Python
python pygame实现方向键控制小球
2019/05/17 Python
PyQt5 QTable插入图片并动态更新的实例
2019/06/18 Python
Python3远程监控程序的实现方法
2019/07/15 Python
python实现抠图给证件照换背景源码
2019/08/20 Python
python 发送json数据操作实例分析
2019/10/15 Python
uniapp+Html5端实现PC端适配
2020/07/15 HTML / CSS
个人查摆剖析材料
2014/02/04 职场文书
小学亲子活动总结
2014/07/01 职场文书
股权转让协议范本
2014/12/07 职场文书
朝花夕拾读书笔记
2015/06/29 职场文书