Python爬取YY评级分数并保存数据实现过程解析


Posted in Python onJune 01, 2020

前言

当需要进行大规模查询时(比如目前遇到的情形:查询某个省所有发债企业的YY评级分数),人工查询显然太过费时,那就写个爬虫吧。

由于该爬虫实在过于简单,就只简单概述下。

一、请求端

通过观察YY评级的网页信息,如下图(F12或右击进入检查,点击network—>XHR—>headers)。

红色框表明是个get请求(其实这种网页基本都是Ajax get,需要总结实际url的规律的)。

绿色框即为实际URL,通过分析该URL,其由两部分组成。前半部分为“
https://web.ratingdog.cn/v1/search?”,后半部分为黄色框内内容用“&”符号连接后的结果。黄色框内的内容,只有企业名称为变量,且为已知变量,那URL即可据此确定了。

Python爬取YY评级分数并保存数据实现过程解析

另外需注意,YY评级需要登录才可查询数据,在构建头部信息进行访问时,一定要提前登录,并在头部信息中放入登录信息和登录状态。

二、响应端

通过观察网页的响应信息(F12或右击进入检查,点击network—>XHR—>response),如下图。响应信息及其简单,我们所需要的YY评级分数安详地躺在那里,简单到一个正则表达式就可以提取出该数据。正则如下:

"msg".*?"IssuerName":"(.*?)","YYRating":"(.*?)/10","IntrinsicRating".*?"

Python爬取YY评级分数并保存数据实现过程解析

三、代码

所需数据较少,代码相对简单,就不建立函数了,直接一路到底吧。如下:

Python爬取YY评级分数并保存数据实现过程解析

运行代码后,得到结果如下。安徽省的100多条数据,就到了本地了

Python爬取YY评级分数并保存数据实现过程解析

Python爬取YY评级分数并保存数据实现过程解析

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
重命名批处理python脚本
Apr 05 Python
Python多线程经典问题之乘客做公交车算法实例
Mar 22 Python
通过Python 接口使用OpenCV的方法
Apr 02 Python
python用fsolve、leastsq对非线性方程组求解
Dec 15 Python
Django中使用CORS实现跨域请求过程解析
Aug 05 Python
Django stark组件使用及原理详解
Aug 22 Python
Tensorflow:转置函数 transpose的使用详解
Feb 11 Python
利用Python自动化操作AutoCAD的实现
Apr 01 Python
python爬虫请求头的使用
Dec 01 Python
pytorch 中forward 的用法与解释说明
Feb 26 Python
PySwarms(Python粒子群优化工具包)的使用:GlobalBestPSO例子解析
Apr 05 Python
Python使用海龟绘图实现贪吃蛇游戏
Jun 18 Python
基于Python绘制个人足迹地图
Jun 01 #Python
python 写函数在一定条件下需要调用自身时的写法说明
Jun 01 #Python
解决python调用自己文件函数/执行函数找不到包问题
Jun 01 #Python
Python如何在循环内使用list.remove()
Jun 01 #Python
IntelliJ 中配置 Anaconda的过程图解
Jun 01 #Python
解决python中import文件夹下面py文件报错问题
Jun 01 #Python
浅谈Python中文件夹和python package包的区别
Jun 01 #Python
You might like
PHP Ajax实现页面无刷新发表评论
2007/01/02 PHP
PHP 最大运行时间 max_execution_time修改方法
2010/03/08 PHP
mysql_escape_string()函数用法分析
2016/04/25 PHP
yii2 resetful 授权验证详解
2017/05/18 PHP
php文件后缀不强制为.php的实操方法
2019/09/18 PHP
基于laravel Request的所有方法详解
2019/09/29 PHP
参考:关于Javascript中实现暂停的几篇文章
2007/03/04 Javascript
javascript实现2048游戏示例
2014/05/04 Javascript
jQuery中insertAfter()方法用法实例
2015/01/08 Javascript
jquery Banner轮播选项卡
2016/12/26 Javascript
AngularJS ng-repeat指令中使用track by子语句解决重复数据遍历错误问题
2017/01/21 Javascript
详解用node.js实现简单的反向代理
2017/06/26 Javascript
jquery-file-upload 文件上传带进度条效果
2017/11/21 jQuery
通过npm或yarn自动生成vue组件的方法示例
2019/02/12 Javascript
Node.js原生api搭建web服务器的方法步骤
2019/02/15 Javascript
面试题:react和vue的区别分析
2019/04/08 Javascript
24个解决实际问题的ES6代码片段(小结)
2020/02/02 Javascript
vue插槽slot的简单理解与用法实例分析
2020/03/14 Javascript
JavaScript 禁止用户保存图片的实现代码
2020/04/28 Javascript
微信小程序学习总结(二)样式、属性、模板操作分析
2020/06/04 Javascript
JS常用跨域方法实现原理解析
2020/12/09 Javascript
Vue看了就会的8个小技巧
2021/01/21 Vue.js
python在windows和linux下获得本机本地ip地址方法小结
2015/03/20 Python
python实现将汉字转换成汉语拼音的库
2015/05/05 Python
Python实现的使用telnet登陆聊天室实例
2015/06/17 Python
Python中使用Counter进行字典创建以及key数量统计的方法
2018/07/06 Python
numpy np.newaxis 的实用分享
2019/11/30 Python
Html5饼图绘制实现统计图的方法
2020/08/05 HTML / CSS
阿根廷网上配眼镜:SmartBuyGlasses阿根廷
2016/08/19 全球购物
行政管理专业推荐信
2013/11/02 职场文书
委托公证书范本
2014/04/03 职场文书
乡镇干部个人对照检查材料思想汇报
2014/10/04 职场文书
个人党性分析材料
2014/12/19 职场文书
信仰纪录片观后感
2015/06/08 职场文书
2016年小学推普宣传周活动总结
2016/04/06 职场文书
python套接字socket通信
2022/04/01 Python