Python爬取YY评级分数并保存数据实现过程解析


Posted in Python onJune 01, 2020

前言

当需要进行大规模查询时(比如目前遇到的情形:查询某个省所有发债企业的YY评级分数),人工查询显然太过费时,那就写个爬虫吧。

由于该爬虫实在过于简单,就只简单概述下。

一、请求端

通过观察YY评级的网页信息,如下图(F12或右击进入检查,点击network—>XHR—>headers)。

红色框表明是个get请求(其实这种网页基本都是Ajax get,需要总结实际url的规律的)。

绿色框即为实际URL,通过分析该URL,其由两部分组成。前半部分为“
https://web.ratingdog.cn/v1/search?”,后半部分为黄色框内内容用“&”符号连接后的结果。黄色框内的内容,只有企业名称为变量,且为已知变量,那URL即可据此确定了。

Python爬取YY评级分数并保存数据实现过程解析

另外需注意,YY评级需要登录才可查询数据,在构建头部信息进行访问时,一定要提前登录,并在头部信息中放入登录信息和登录状态。

二、响应端

通过观察网页的响应信息(F12或右击进入检查,点击network—>XHR—>response),如下图。响应信息及其简单,我们所需要的YY评级分数安详地躺在那里,简单到一个正则表达式就可以提取出该数据。正则如下:

"msg".*?"IssuerName":"(.*?)","YYRating":"(.*?)/10","IntrinsicRating".*?"

Python爬取YY评级分数并保存数据实现过程解析

三、代码

所需数据较少,代码相对简单,就不建立函数了,直接一路到底吧。如下:

Python爬取YY评级分数并保存数据实现过程解析

运行代码后,得到结果如下。安徽省的100多条数据,就到了本地了

Python爬取YY评级分数并保存数据实现过程解析

Python爬取YY评级分数并保存数据实现过程解析

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python备份Mysql脚本
Aug 11 Python
python共享引用(多个变量引用)示例代码
Dec 04 Python
如何搜索查找并解决Django相关的问题
Jun 30 Python
Python socket编程实例详解
May 27 Python
python简单获取数组元素个数的方法
Jul 13 Python
python中利用Future对象异步返回结果示例代码
Sep 07 Python
python使用PIL模块获取图片像素点的方法
Jan 08 Python
Python脚本修改阿里云的访问控制列表的方法
Mar 08 Python
解决pycharm最左侧Tool Buttons显示不全的问题
Dec 17 Python
Python中全局变量和局部变量的理解与区别
Feb 07 Python
如何在Python项目中引入日志
May 31 Python
Python3接口性能测试实例代码
Jun 20 Python
基于Python绘制个人足迹地图
Jun 01 #Python
python 写函数在一定条件下需要调用自身时的写法说明
Jun 01 #Python
解决python调用自己文件函数/执行函数找不到包问题
Jun 01 #Python
Python如何在循环内使用list.remove()
Jun 01 #Python
IntelliJ 中配置 Anaconda的过程图解
Jun 01 #Python
解决python中import文件夹下面py文件报错问题
Jun 01 #Python
浅谈Python中文件夹和python package包的区别
Jun 01 #Python
You might like
PHP在引号前面添加反斜杠(PHP去除反斜杠)
2013/09/28 PHP
PHP生成等比缩略图类和自定义函数分享
2014/06/25 PHP
php使用Cookie实现和用户会话的方法
2015/01/21 PHP
浅谈javascript六种数据类型以及特殊注意点
2013/12/20 Javascript
jquery网页回到顶部效果(图标渐隐,自写)
2014/06/16 Javascript
技术男用来对妹子表白的百度首页
2014/07/23 Javascript
jQuery中extend函数的实现原理详解
2015/02/03 Javascript
js实现从中间开始往上下展开网页窗口的方法
2015/03/02 Javascript
浅析在javascript中创建对象的各种模式
2016/05/06 Javascript
轻松掌握JavaScript代理模式
2016/08/26 Javascript
js 弹出虚拟键盘修改密码的简单实例
2016/10/10 Javascript
vue实现页面加载动画效果
2017/09/19 Javascript
详解Angular模板引用变量及其作用域
2018/11/23 Javascript
JSON的parse()方法介绍
2019/01/31 Javascript
浅谈JS中this在各个场景下的指向
2019/08/14 Javascript
详解vue中在父组件点击按钮触发子组件的事件
2020/11/13 Javascript
python实现的jpg格式图片修复代码
2015/04/21 Python
python中使用PIL制作并验证图片验证码
2018/03/15 Python
Python实现字符串的逆序 C++字符串逆序算法
2020/05/28 Python
python指定写入文件时的编码格式方法
2018/06/07 Python
python实现飞行棋游戏
2020/02/05 Python
Python模块相关知识点小结
2020/03/09 Python
Python DES加密实现原理及实例解析
2020/07/17 Python
香港优质食材和美酒专门店:FoodWise
2017/09/01 全球购物
Aeropostale官网:美国著名校园品牌及青少年服饰品牌
2019/03/21 全球购物
C#如何允许一个类被继承但是避免这个类的方法被重载?
2015/02/24 面试题
生物化学研究助理员求职信
2013/10/09 职场文书
2014幼儿园大班工作总结
2014/11/10 职场文书
师德标兵事迹材料
2014/12/19 职场文书
网吧温馨提示
2015/07/17 职场文书
致运动员加油稿
2015/07/21 职场文书
2015年政治教研组工作总结
2015/07/22 职场文书
婚宴致辞
2015/07/28 职场文书
使用python如何删除同一文件夹下相似的图片
2021/05/07 Python
浅谈Vue的computed计算属性
2022/03/21 Vue.js
python使用pycharm安装pyqt5以及相关配置
2022/04/22 Python