Selenium+BeautifulSoup+json获取Script标签内的json数据


Posted in Python onDecember 07, 2020

Selenium爬虫遇到 数据是以 JSON 字符串的形式包裹在 Script 标签中,

假设Script标签下代码如下:

<script id="DATA_INFO" type="application/json" >
{
  "user": {
    "isLogin": true,
    "userInfo": {
      "id": 123456,
      "nickname": "LiMing",
      "intro": "人生苦短,我用python"
    }
  }
}
</script>

此时drive.find_elements_by_xpath('//*[@id="DATA_INFO"] 只能定位到元素,但是无法通过.text方法,获取Script标签下的json数据

from bs4 import BeautifulSoup as bs
import json as js
#selenium获取当前页面源码
html = drive.page_source
#BeautifulSoup转换页面源码
bs=BeautifulSoup(html,'lxml')
#获取Script标签下的完整json数据,并通过json加载成字典格式
js_test=js.loads(bs.find("script",{"id":"DATA_INFO"}).get_text())
#获取Script标签下的nickname 值
js_tes

到此这篇关于Selenium+BeautifulSoup+json获取Script标签内的json数据的文章就介绍到这了,更多相关Selenium+BeautifulSoup获取json内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
用python代码做configure文件
Jul 20 Python
python实现的简单文本类游戏实例
Apr 28 Python
python常见的格式化输出小结
Dec 15 Python
Python实现读取txt文件并转换为excel的方法示例
May 17 Python
示例详解Python3 or Python2 两者之间的差异
Aug 23 Python
浅析python3字符串格式化format()函数的简单用法
Dec 07 Python
Python使用requests xpath 并开启多线程爬取西刺代理ip实例
Mar 06 Python
python3中sorted函数里cmp参数改变详解
Mar 12 Python
Django全局启用登陆验证login_required的方法
Jun 02 Python
常用的10个Python实用小技巧
Aug 10 Python
django如何自定义manage.py管理命令
Apr 27 Python
教你使用Python pypinyin库实现汉字转拼音
May 27 Python
Python爬虫实战案例之爬取喜马拉雅音频数据详解
Dec 07 #Python
用python对excel查重
Dec 07 #Python
python3 通过 pybind11 使用Eigen加速代码的步骤详解
Dec 07 #Python
python 通过 pybind11 使用Eigen加速代码的步骤
Dec 07 #Python
Python中BeautifulSoup通过查找Id获取元素信息
Dec 07 #Python
BeautifulSoup中find和find_all的使用详解
Dec 07 #Python
python爬虫beautifulsoup解析html方法
Dec 07 #Python
You might like
PHP 字符串 小常识
2009/06/05 PHP
php中实现记住密码自动登录的代码
2011/03/02 PHP
几行代码轻松实现PHP文件打包下载zip
2017/03/01 PHP
浅谈PHP表单提交(POST&amp;GET&amp;URL编/解码)
2017/04/03 PHP
一段利用WSH获取登录时间的jscript代码
2008/05/11 Javascript
jQuery-Tools-overlay 使用介绍
2012/07/14 Javascript
jquery.messager.js插件导致页面抖动的解决方法
2013/07/14 Javascript
jQuery拖动div、移动div、弹出层实现原理及示例
2014/04/08 Javascript
jQuery select表单提交省市区城市三级联动核心代码
2014/06/09 Javascript
原生javascript实现Tab选项卡切换功能
2015/01/12 Javascript
js验证身份证号有效性并提示对应信息
2015/10/19 Javascript
javascript实现动态统计图开发实例
2015/11/21 Javascript
nodejs修复ipa处理过的png图片
2016/02/17 NodeJs
Angular 2父子组件之间共享服务通信的实现
2017/07/04 Javascript
浅谈webpack-dev-server的配置和使用
2018/05/17 Javascript
脚手架vue-cli工程webpack的基本用法详解
2018/09/29 Javascript
ES6 Array常用扩展的应用实例分析
2019/06/26 Javascript
layui使用数据表格实现购物车功能
2019/07/26 Javascript
使用Python脚本对Linux服务器进行监控的教程
2015/04/02 Python
编写Python CGI脚本的教程
2015/06/29 Python
Python实现统计代码行的方法分析
2017/07/12 Python
利用python获取当前日期前后N天或N月日期的方法示例
2017/07/30 Python
python中virtualenvwrapper安装与使用
2018/05/20 Python
python format 格式化输出方法
2018/07/16 Python
解决Django加载静态资源失败的问题
2019/07/28 Python
django基于cors解决跨域请求问题详解
2019/08/06 Python
Python datetime模块使用方法小结
2020/06/18 Python
Python调用JavaScript代码的方法
2020/10/27 Python
html5各种页面切换效果和模态对话框用法总结
2014/12/15 HTML / CSS
加拿大租车网站:Enterprise Rent-A-Car
2018/07/26 全球购物
办公室副主任岗位职责
2013/11/25 职场文书
论文指导教师评语
2014/04/28 职场文书
创卫工作总结2015
2015/04/22 职场文书
幼儿园师德师风心得体会
2016/01/12 职场文书
导游词之太原天龙山
2020/01/02 职场文书
python实战之90行代码写个猜数字游戏
2021/04/22 Python