Python爬虫爬取博客实现可视化过程解析


Posted in Python onJune 29, 2020

源码:

from pyecharts import Bar
import re
import requests
num=0
b=[]
for i in range(1,11):
  link='https://www.cnblogs.com/echoDetected/default.html?page='+str(i)
  headers={'user-agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/72.0.3626.109 Safari/537.36'}
  r=requests.get(link,headers=headers)
  html=r.text
  post=re.findall('<span class="post-view-count">(.*?)</span>',html)
for i in post:
    i = i.replace("阅读(", "")
    i = i.replace(")","")
    b.append(i)
    num=num+1
columns=[]
for i in range(1,num+1):
#设置行名
  columns.append('博客'+str(i))
#设置数据
#设置柱状图的主标题与副标题
bar = Bar("柱状图", "每个博客阅读数量")
#添加柱状图的数据及配置项,先行后列
bar.add("阅读量", columns, b, mark_line=["average"], mark_point=["max", "min"])
#生成本地文件(默认为.html文件)
bar.render()

爬虫不是重点,只是拿来爬阅读数量,pyecharts是重点

这次爬的是我自己的博客,一共10页,每页10片文章,正好写了100篇博客

pyecharts安装:

pip install wheelpip install pyecharts==0.1.9.4

直接pip install pyecharts会下载最新版无法调用

注意点:pyecharts调用,貌似无法实现多个py文件一起调用(意思是编写时不能在多个文件里出现import语句)

步骤解释:

1.爬虫爬取阅读数

2.去除非法字符装入新的数组

3.设置横轴数据,生成柱状图

4.在当前目录下生成render.html,打开查看柱状图

结果:

Python爬虫爬取博客实现可视化过程解析

柱状图是动态的,不是静态的

Python爬虫爬取博客实现可视化过程解析

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python中的fileinput模块的简单实用示例
Jul 09 Python
Python3基于sax解析xml操作示例
May 22 Python
Python subprocess模块功能与常见用法实例详解
Jun 28 Python
python3.x 将byte转成字符串的方法
Jul 17 Python
关于python列表增加元素的三种操作方法
Aug 22 Python
Python使用pandas和xlsxwriter读写xlsx文件的方法示例
Apr 09 Python
解决Python中pandas读取*.csv文件出现编码问题
Jul 12 Python
实例详解Python装饰器与闭包
Jul 29 Python
解决Python pip 自动更新升级失败的问题
Feb 21 Python
pytorch实现查看当前学习率
Jun 24 Python
Python sqlalchemy时间戳及密码管理实现代码详解
Aug 01 Python
python基础之匿名函数详解
Apr 21 Python
使用keras框架cnn+ctc_loss识别不定长字符图片操作
Jun 29 #Python
浅谈keras中的后端backend及其相关函数(K.prod,K.cast)
Jun 29 #Python
如何使用python记录室友的抖音在线时间
Jun 29 #Python
Python sublime安装及配置过程详解
Jun 29 #Python
keras K.function获取某层的输出操作
Jun 29 #Python
Python pytesseract验证码识别库用法解析
Jun 29 #Python
用Python开发app后端有优势吗
Jun 29 #Python
You might like
php 生成静态页面的办法与实现代码详细版
2010/02/15 PHP
深入理解PHP之数组(遍历顺序)  Laruence原创
2012/06/13 PHP
php 无法加载mcrypt.dll的解决办法
2013/04/03 PHP
php基于表单密码验证与HTTP验证用法实例
2015/01/06 PHP
PHP微信开发用Cache 解决数据缓存
2016/07/11 PHP
PHP 实现从数据库导出到.csv文件方法
2017/07/06 PHP
PHP双向链表定义与用法示例
2018/01/31 PHP
laravel 解决多库下的DB::transaction()事务失效问题
2019/10/21 PHP
jQuery的学习步骤
2011/02/23 Javascript
javascript 全选与全取消功能的实现代码
2012/12/23 Javascript
获取select元素被选中的文本内容的js代码
2014/01/29 Javascript
使用AngularJS对路由进行安全性处理的方法
2015/06/18 Javascript
javascript中html字符串转化为jquery dom对象的方法
2015/08/27 Javascript
JS之获取样式的简单实现方法(推荐)
2016/09/13 Javascript
基于JavaScript实现前端文件的断点续传
2016/10/17 Javascript
jQuery实现的省市联动菜单功能示例【测试可用】
2017/01/13 Javascript
jQuery实现用户输入自动完成功能
2017/02/13 Javascript
vue-router项目实战总结篇
2018/02/11 Javascript
vue实现点击选中,其他的不选中方法
2018/09/05 Javascript
微信小程序动画组件使用解析,类似vue,且更强大
2019/08/01 Javascript
推荐几个不错的console调试技巧实现
2019/12/20 Javascript
[01:18:43]2014 DOTA2华西杯精英邀请赛5 24 iG VS DK
2014/05/25 DOTA
[47:36]Optic vs Newbee 2018国际邀请赛小组赛BO2 第二场 8.17
2018/08/18 DOTA
pybind11在Windows下的使用教程
2019/07/04 Python
Django如何实现上传图片功能
2019/08/16 Python
wxPython之wx.DC绘制形状
2019/11/19 Python
Python使用扩展库pywin32实现批量文档打印实例
2020/04/09 Python
Python生成器next方法和send方法区别详解
2020/05/30 Python
请解释流与文件有什么不同
2016/07/29 面试题
担保书格式及范文
2014/04/01 职场文书
党支部承诺书
2015/01/20 职场文书
蓬莱阁导游词
2015/02/04 职场文书
2015应届毕业生自荐信范文
2015/03/05 职场文书
2015年护理工作总结范文
2015/04/03 职场文书
关于践行三严三实的心得体会
2016/01/05 职场文书
TV动画「神渣☆爱豆」公开第一弹主视觉图
2022/03/21 日漫