Python爬虫爬取博客实现可视化过程解析


Posted in Python onJune 29, 2020

源码:

from pyecharts import Bar
import re
import requests
num=0
b=[]
for i in range(1,11):
  link='https://www.cnblogs.com/echoDetected/default.html?page='+str(i)
  headers={'user-agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/72.0.3626.109 Safari/537.36'}
  r=requests.get(link,headers=headers)
  html=r.text
  post=re.findall('<span class="post-view-count">(.*?)</span>',html)
for i in post:
    i = i.replace("阅读(", "")
    i = i.replace(")","")
    b.append(i)
    num=num+1
columns=[]
for i in range(1,num+1):
#设置行名
  columns.append('博客'+str(i))
#设置数据
#设置柱状图的主标题与副标题
bar = Bar("柱状图", "每个博客阅读数量")
#添加柱状图的数据及配置项,先行后列
bar.add("阅读量", columns, b, mark_line=["average"], mark_point=["max", "min"])
#生成本地文件(默认为.html文件)
bar.render()

爬虫不是重点,只是拿来爬阅读数量,pyecharts是重点

这次爬的是我自己的博客,一共10页,每页10片文章,正好写了100篇博客

pyecharts安装:

pip install wheelpip install pyecharts==0.1.9.4

直接pip install pyecharts会下载最新版无法调用

注意点:pyecharts调用,貌似无法实现多个py文件一起调用(意思是编写时不能在多个文件里出现import语句)

步骤解释:

1.爬虫爬取阅读数

2.去除非法字符装入新的数组

3.设置横轴数据,生成柱状图

4.在当前目录下生成render.html,打开查看柱状图

结果:

Python爬虫爬取博客实现可视化过程解析

柱状图是动态的,不是静态的

Python爬虫爬取博客实现可视化过程解析

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python获得文件创建时间和修改时间的方法
Jun 30 Python
python中利用Future对象回调别的函数示例代码
Sep 07 Python
Python使用matplotlib模块绘制图像并设置标题与坐标轴等信息示例
May 04 Python
PyTorch线性回归和逻辑回归实战示例
May 22 Python
浅析python3字符串格式化format()函数的简单用法
Dec 07 Python
详解python中sort排序使用
Mar 23 Python
pandas中DataFrame修改index、columns名的方法示例
Aug 02 Python
Python实现平行坐标图的绘制(plotly)方式
Nov 22 Python
Pytorch evaluation每次运行结果不同的解决
Jan 02 Python
python 统计代码耗时的几种方法分享
Apr 02 Python
在pycharm中无法import所安装的库解决方案
May 31 Python
Python如何使用循环结构和分支结构
Apr 13 Python
使用keras框架cnn+ctc_loss识别不定长字符图片操作
Jun 29 #Python
浅谈keras中的后端backend及其相关函数(K.prod,K.cast)
Jun 29 #Python
如何使用python记录室友的抖音在线时间
Jun 29 #Python
Python sublime安装及配置过程详解
Jun 29 #Python
keras K.function获取某层的输出操作
Jun 29 #Python
Python pytesseract验证码识别库用法解析
Jun 29 #Python
用Python开发app后端有优势吗
Jun 29 #Python
You might like
linux下使用ThinkPHP需要注意大小写导致的问题
2011/08/02 PHP
php 文件上传实例代码
2012/04/19 PHP
php自动提交表单的方法(基于fsockopen与curl)
2016/05/09 PHP
php 无限分类 树形数据格式化代码
2016/10/11 PHP
Js 中debug方式
2010/02/07 Javascript
Jquery 扩展方法
2010/05/06 Javascript
javascript 正则替换 replace(regExp, function)用法
2010/05/22 Javascript
邮箱下拉自动填充选择示例代码附图
2014/04/03 Javascript
jQuery实现的导航下拉菜单效果
2016/07/04 Javascript
JS日期对象简单操作(获取当前年份、星期、时间)
2016/10/26 Javascript
jQuery实现导航高亮的方法【附demo源码下载】
2016/11/09 Javascript
vue2组件实现懒加载浅析
2017/03/29 Javascript
解析NodeJS异步I/O的实现
2017/04/13 NodeJs
浅析从vue源码看观察者模式
2018/01/29 Javascript
jQuery实现炫丽的3d旋转星空效果
2018/07/04 jQuery
在vue中使用vue-echarts-v3的实例代码
2018/09/13 Javascript
Vue动态加载异步组件的方法
2018/11/21 Javascript
微信小程序左滑删除实现代码实例
2019/09/16 Javascript
[19:24]DOTA2客户端使用指南 一分钟快速设置轻松超神
2013/09/24 DOTA
Python选择排序、冒泡排序、合并排序代码实例
2015/04/10 Python
scrapy爬虫实例分享
2017/12/28 Python
Python 判断 有向图 是否有环的实例讲解
2018/02/01 Python
Python图像滤波处理操作示例【基于ImageFilter类】
2019/01/03 Python
python实现数据清洗(缺失值与异常值处理)
2019/12/02 Python
Django Admin后台模型列表页面如何添加自定义操作按钮
2020/11/11 Python
HTML5+CSS3模仿优酷视频截图功能示例
2017/01/05 HTML / CSS
电脑教师的教学自我评价
2013/11/26 职场文书
校园招聘策划书
2014/01/09 职场文书
大学校庆策划书
2014/01/31 职场文书
化妆品促销方案
2014/02/24 职场文书
英语教师自荐信
2014/05/26 职场文书
办公室文员岗位职责范本
2014/06/12 职场文书
2014和解协议书范文
2014/09/15 职场文书
行政介绍信范文
2015/05/04 职场文书
团组织关系介绍信
2019/06/24 职场文书
用Python提取PDF表格的方法
2021/04/11 Python