Python爬虫爬取博客实现可视化过程解析


Posted in Python onJune 29, 2020

源码:

from pyecharts import Bar
import re
import requests
num=0
b=[]
for i in range(1,11):
  link='https://www.cnblogs.com/echoDetected/default.html?page='+str(i)
  headers={'user-agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/72.0.3626.109 Safari/537.36'}
  r=requests.get(link,headers=headers)
  html=r.text
  post=re.findall('<span class="post-view-count">(.*?)</span>',html)
for i in post:
    i = i.replace("阅读(", "")
    i = i.replace(")","")
    b.append(i)
    num=num+1
columns=[]
for i in range(1,num+1):
#设置行名
  columns.append('博客'+str(i))
#设置数据
#设置柱状图的主标题与副标题
bar = Bar("柱状图", "每个博客阅读数量")
#添加柱状图的数据及配置项,先行后列
bar.add("阅读量", columns, b, mark_line=["average"], mark_point=["max", "min"])
#生成本地文件(默认为.html文件)
bar.render()

爬虫不是重点,只是拿来爬阅读数量,pyecharts是重点

这次爬的是我自己的博客,一共10页,每页10片文章,正好写了100篇博客

pyecharts安装:

pip install wheelpip install pyecharts==0.1.9.4

直接pip install pyecharts会下载最新版无法调用

注意点:pyecharts调用,貌似无法实现多个py文件一起调用(意思是编写时不能在多个文件里出现import语句)

步骤解释:

1.爬虫爬取阅读数

2.去除非法字符装入新的数组

3.设置横轴数据,生成柱状图

4.在当前目录下生成render.html,打开查看柱状图

结果:

Python爬虫爬取博客实现可视化过程解析

柱状图是动态的,不是静态的

Python爬虫爬取博客实现可视化过程解析

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python实现的文件同步服务器实例
Jun 02 Python
Python快速从注释生成文档的方法
Dec 26 Python
Python读取Json字典写入Excel表格的方法
Jan 03 Python
十分钟利用Python制作属于你自己的个性logo
May 07 Python
Python opencv实现人眼/人脸识别以及实时打码处理
Apr 29 Python
python 修改本地网络配置的方法
Aug 14 Python
Python手绘可视化工具cutecharts使用实例
Dec 05 Python
tornado+celery的简单使用详解
Dec 21 Python
Python3 shutil(高级文件操作模块)实例用法总结
Feb 19 Python
matplotlib 三维图表绘制方法简介
Sep 20 Python
详解python的xlwings库读写excel操作总结
Feb 26 Python
python基础学习之递归函数知识总结
May 26 Python
使用keras框架cnn+ctc_loss识别不定长字符图片操作
Jun 29 #Python
浅谈keras中的后端backend及其相关函数(K.prod,K.cast)
Jun 29 #Python
如何使用python记录室友的抖音在线时间
Jun 29 #Python
Python sublime安装及配置过程详解
Jun 29 #Python
keras K.function获取某层的输出操作
Jun 29 #Python
Python pytesseract验证码识别库用法解析
Jun 29 #Python
用Python开发app后端有优势吗
Jun 29 #Python
You might like
通过ODBC连接的SQL SERVER实例
2006/10/09 PHP
php从文件夹随机读取文件的方法
2015/06/01 PHP
PHP递归统计系统中代码行数
2019/09/19 PHP
比较简单的一个符合web标准的JS调用flash方法
2007/11/29 Javascript
javascript Keycode对照表
2009/10/24 Javascript
JavaScript判断字符长度、数字、Email、电话等常用判断函数分享
2015/04/01 Javascript
纯js实现手风琴效果
2020/04/17 Javascript
AngularJS基础 ng-cloak 指令简单示例
2016/08/01 Javascript
js前端面试题及答案整理(一)
2016/08/26 Javascript
Vue脚手架的简单使用实例
2018/07/10 Javascript
原生JS实现的轮播图功能详解
2018/08/06 Javascript
详解VUE Element-UI多级菜单动态渲染的组件
2019/04/25 Javascript
vue 父组件通过$refs获取子组件的值和方法详解
2019/11/07 Javascript
JS+DIV实现拖动效果
2020/02/11 Javascript
Python 异常处理实例详解
2014/03/12 Python
Win7 64位下python3.6.5安装配置图文教程
2020/10/27 Python
python 实现返回一个列表中出现次数最多的元素方法
2019/06/11 Python
实例详解Python模块decimal
2019/06/26 Python
python Pandas如何对数据集随机抽样
2019/07/29 Python
Python 调用 Outlook 发送邮件过程解析
2019/08/08 Python
python bluetooth蓝牙信息获取蓝牙设备类型的方法
2019/11/29 Python
C/C++有关内存的思考题
2015/12/04 面试题
C#面试题
2016/05/06 面试题
J2ee常用的设计模式?说明工厂模式
2015/05/21 面试题
出纳岗位职责
2013/11/09 职场文书
大学自主招生自荐信范文
2014/02/26 职场文书
《海伦?凯勒》教学反思
2014/04/17 职场文书
商场客服专员岗位职责
2014/06/13 职场文书
品质口号大全
2014/06/17 职场文书
运动会广播稿150字(9篇)
2014/09/20 职场文书
县委班子四风对照检查材料思想汇报
2014/09/29 职场文书
泸县召开党的群众路线教育实践活动总结大会新闻稿
2014/10/21 职场文书
志愿者事迹材料
2014/12/26 职场文书
心得体会格式及范文
2016/01/25 职场文书
python基础之文件处理知识总结
2021/05/23 Python
mysql如何能有效防止删库跑路
2021/10/05 MySQL