Python爬虫爬取博客实现可视化过程解析


Posted in Python onJune 29, 2020

源码:

from pyecharts import Bar
import re
import requests
num=0
b=[]
for i in range(1,11):
  link='https://www.cnblogs.com/echoDetected/default.html?page='+str(i)
  headers={'user-agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/72.0.3626.109 Safari/537.36'}
  r=requests.get(link,headers=headers)
  html=r.text
  post=re.findall('<span class="post-view-count">(.*?)</span>',html)
for i in post:
    i = i.replace("阅读(", "")
    i = i.replace(")","")
    b.append(i)
    num=num+1
columns=[]
for i in range(1,num+1):
#设置行名
  columns.append('博客'+str(i))
#设置数据
#设置柱状图的主标题与副标题
bar = Bar("柱状图", "每个博客阅读数量")
#添加柱状图的数据及配置项,先行后列
bar.add("阅读量", columns, b, mark_line=["average"], mark_point=["max", "min"])
#生成本地文件(默认为.html文件)
bar.render()

爬虫不是重点,只是拿来爬阅读数量,pyecharts是重点

这次爬的是我自己的博客,一共10页,每页10片文章,正好写了100篇博客

pyecharts安装:

pip install wheelpip install pyecharts==0.1.9.4

直接pip install pyecharts会下载最新版无法调用

注意点:pyecharts调用,貌似无法实现多个py文件一起调用(意思是编写时不能在多个文件里出现import语句)

步骤解释:

1.爬虫爬取阅读数

2.去除非法字符装入新的数组

3.设置横轴数据,生成柱状图

4.在当前目录下生成render.html,打开查看柱状图

结果:

Python爬虫爬取博客实现可视化过程解析

柱状图是动态的,不是静态的

Python爬虫爬取博客实现可视化过程解析

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python中for语句简单遍历数据的方法
May 07 Python
python中异常报错处理方法汇总
Nov 20 Python
详解pyqt5 动画在QThread线程中无法运行问题
May 05 Python
详解python如何在django中为用户模型添加自定义权限
Oct 15 Python
使用Python实现在Windows下安装Django
Oct 17 Python
Python re 模块findall() 函数返回值展现方式解析
Aug 09 Python
python numpy库linspace相同间隔采样的实现
Feb 25 Python
Python反爬虫伪装浏览器进行爬虫
Feb 28 Python
django-利用session机制实现唯一登录的例子
Mar 16 Python
Python模拟伯努利试验和二项分布代码实例
May 27 Python
python tqdm库的使用
Nov 30 Python
Python批量删除mysql中千万级大量数据的脚本分享
Dec 03 Python
使用keras框架cnn+ctc_loss识别不定长字符图片操作
Jun 29 #Python
浅谈keras中的后端backend及其相关函数(K.prod,K.cast)
Jun 29 #Python
如何使用python记录室友的抖音在线时间
Jun 29 #Python
Python sublime安装及配置过程详解
Jun 29 #Python
keras K.function获取某层的输出操作
Jun 29 #Python
Python pytesseract验证码识别库用法解析
Jun 29 #Python
用Python开发app后端有优势吗
Jun 29 #Python
You might like
php 静态页面中显示动态内容
2009/08/14 PHP
分享一段php获取linux服务器状态的代码
2014/05/27 PHP
PHP改进计算字符串相似度的函数similar_text()、levenshtein()
2014/10/27 PHP
php绘图之在图片上写中文和英文的方法
2015/01/24 PHP
php实现的二叉树遍历算法示例
2017/06/15 PHP
原生php实现excel文件读写的方法分析
2018/04/25 PHP
PHP实现抽奖功能实例代码
2020/06/30 PHP
[原创]来自ImageSee官方 JavaScript图片浏览器
2008/01/16 Javascript
ie下动态加态js文件的方法
2011/09/13 Javascript
extjs实现选择多表自定义查询功能 前台部分(ext源码)
2011/12/20 Javascript
jquery 获取自定义属性(attr和prop)的实现代码
2012/06/27 Javascript
通过js来制作复选框的全选和不选效果
2014/05/22 Javascript
用JavaScript实现使用鼠标画线的示例代码
2014/08/19 Javascript
使用CSS+JavaScript或纯js实现半透明遮罩效果的实例分享
2016/05/09 Javascript
jquery html5 视频播放控制代码
2016/11/06 Javascript
Node.js对MongoDB数据库实现模糊查询的方法
2017/05/03 Javascript
详谈js模块化规范
2017/07/07 Javascript
VUE长按事件需求详解
2017/10/18 Javascript
Angular2学习笔记之数据绑定的示例代码
2018/01/03 Javascript
vue+webpack实现异步组件加载的方法
2018/02/03 Javascript
JS实现的A*寻路算法详解
2018/12/14 Javascript
python2 中 unicode 和 str 之间的转换及与python3 str 的区别
2019/07/25 Python
Python3.6实现根据电影名称(支持电视剧名称),获取下载链接的方法
2019/08/26 Python
python turtle 绘制太极图的实例
2019/12/18 Python
Pycharm中配置远程Docker运行环境的教程图解
2020/06/11 Python
python使用dlib进行人脸检测和关键点的示例
2020/12/05 Python
html5 自定义播放器核心代码
2013/12/20 HTML / CSS
Volcom法国官网:美国冲浪滑板品牌
2017/05/25 全球购物
abstract class和interface有什么区别?
2012/01/03 面试题
幼儿园大班新学期寄语
2014/01/18 职场文书
经理秘书求职自荐信范文
2014/03/23 职场文书
给老婆的检讨书(搞笑版)
2015/05/06 职场文书
预备党员考察意见范文
2015/06/01 职场文书
刑事法律意见书
2015/06/04 职场文书
MySQL 1130异常,无法远程登录解决方案详解
2021/08/23 MySQL
MySql按时,天,周,月进行数据统计
2022/08/14 MySQL