Selenium+BeautifulSoup+json获取Script标签内的json数据


Posted in Python onDecember 07, 2020

Selenium爬虫遇到 数据是以 JSON 字符串的形式包裹在 Script 标签中,

假设Script标签下代码如下:

<script id="DATA_INFO" type="application/json" >
{
  "user": {
    "isLogin": true,
    "userInfo": {
      "id": 123456,
      "nickname": "LiMing",
      "intro": "人生苦短,我用python"
    }
  }
}
</script>

此时drive.find_elements_by_xpath('//*[@id="DATA_INFO"] 只能定位到元素,但是无法通过.text方法,获取Script标签下的json数据

from bs4 import BeautifulSoup as bs
import json as js
#selenium获取当前页面源码
html = drive.page_source
#BeautifulSoup转换页面源码
bs=BeautifulSoup(html,'lxml')
#获取Script标签下的完整json数据,并通过json加载成字典格式
js_test=js.loads(bs.find("script",{"id":"DATA_INFO"}).get_text())
#获取Script标签下的nickname 值
js_tes

到此这篇关于Selenium+BeautifulSoup+json获取Script标签内的json数据的文章就介绍到这了,更多相关Selenium+BeautifulSoup获取json内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
初步剖析C语言编程中的结构体
Jan 16 Python
Using Django with GAE Python 后台抓取多个网站的页面全文
Feb 17 Python
Python实现类似jQuery使用中的链式调用的示例
Jun 16 Python
Python 中pandas.read_excel详细介绍
Jun 23 Python
pyqt5移动鼠标显示坐标的方法
Jun 21 Python
django认证系统实现自定义权限管理的方法
Aug 28 Python
Python3 解决读取中文文件txt编码的问题
Dec 20 Python
python通过文本在一个图中画多条线的实例
Feb 21 Python
PyCharm 无法 import pandas 程序卡住的解决方式
Mar 09 Python
python 工具 字符串转numpy浮点数组的实现
Mar 14 Python
Python中的Cookie模块如何使用
Jun 04 Python
解决Pymongo insert时会自动添加_id的问题
Dec 05 Python
Python爬虫实战案例之爬取喜马拉雅音频数据详解
Dec 07 #Python
用python对excel查重
Dec 07 #Python
python3 通过 pybind11 使用Eigen加速代码的步骤详解
Dec 07 #Python
python 通过 pybind11 使用Eigen加速代码的步骤
Dec 07 #Python
Python中BeautifulSoup通过查找Id获取元素信息
Dec 07 #Python
BeautifulSoup中find和find_all的使用详解
Dec 07 #Python
python爬虫beautifulsoup解析html方法
Dec 07 #Python
You might like
2021年最新CPU天梯图
2021/03/04 数码科技
php curl_init函数用法
2014/01/31 PHP
PHP开发框架laravel安装与配置教程
2015/03/13 PHP
php-fpm重启导致的程序执行中断问题详解
2019/04/29 PHP
php创建类并调用的实例方法
2019/09/25 PHP
浅谈PHP之ThinkPHP框架使用详解
2020/07/21 PHP
分享一个asp.net pager分页控件
2012/01/04 Javascript
js判读浏览器是否支持html5的canvas的代码
2013/11/18 Javascript
angularjs学习笔记之三大模块(modal,controller,view)
2015/09/26 Javascript
需要牢记的JavaScript基础知识
2016/09/25 Javascript
jsonp跨域请求详解
2017/07/13 Javascript
微信小程序实现选项卡功能
2020/06/19 Javascript
使用elementUI实现将图片上传到本地的示例
2018/09/04 Javascript
Nodejs对postgresql基本操作的封装方法
2019/02/20 NodeJs
jquery简单实现纵向的无缝滚动代码实例
2019/04/01 jQuery
JavaScript展开操作符(Spread operator)详解
2019/07/20 Javascript
基于Vue 撸一个指令实现拖拽功能
2019/10/09 Javascript
十分钟教你上手ES2020新特性
2020/02/12 Javascript
如何在postman测试用例中实现断言过程解析
2020/07/09 Javascript
python list语法学习(带例子)
2013/11/01 Python
使用python在校内发人人网状态(人人网看状态)
2014/02/19 Python
详解Python中的相对导入和绝对导入
2017/01/06 Python
python 性能优化方法小结
2017/03/31 Python
详解python 拆包可迭代数据如tuple, list
2017/12/29 Python
pandas创建新Dataframe并添加多行的实例
2018/04/08 Python
Python数据类型之列表和元组的方法实例详解
2019/07/08 Python
Pyspark获取并处理RDD数据代码实例
2020/03/27 Python
django执行原始查询sql,并返回Dict字典例子
2020/04/01 Python
联想中国官方商城:Lenovo China
2017/10/18 全球购物
亚马逊意大利站点:Amazon.it
2020/12/31 全球购物
递归计算如下递归函数的值(斐波拉契)
2012/02/04 面试题
EJB的激活机制
2013/10/25 面试题
小学生期末评语
2014/04/21 职场文书
2014年终工作总结范本
2014/12/15 职场文书
《藏戏》教学反思
2016/02/23 职场文书
告诉你创业计划书的8个实用技巧
2019/07/12 职场文书