Python爬虫爬取博客实现可视化过程解析


Posted in Python onJune 29, 2020

源码:

from pyecharts import Bar
import re
import requests
num=0
b=[]
for i in range(1,11):
  link='https://www.cnblogs.com/echoDetected/default.html?page='+str(i)
  headers={'user-agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/72.0.3626.109 Safari/537.36'}
  r=requests.get(link,headers=headers)
  html=r.text
  post=re.findall('<span class="post-view-count">(.*?)</span>',html)
for i in post:
    i = i.replace("阅读(", "")
    i = i.replace(")","")
    b.append(i)
    num=num+1
columns=[]
for i in range(1,num+1):
#设置行名
  columns.append('博客'+str(i))
#设置数据
#设置柱状图的主标题与副标题
bar = Bar("柱状图", "每个博客阅读数量")
#添加柱状图的数据及配置项,先行后列
bar.add("阅读量", columns, b, mark_line=["average"], mark_point=["max", "min"])
#生成本地文件(默认为.html文件)
bar.render()

爬虫不是重点,只是拿来爬阅读数量,pyecharts是重点

这次爬的是我自己的博客,一共10页,每页10片文章,正好写了100篇博客

pyecharts安装:

pip install wheelpip install pyecharts==0.1.9.4

直接pip install pyecharts会下载最新版无法调用

注意点:pyecharts调用,貌似无法实现多个py文件一起调用(意思是编写时不能在多个文件里出现import语句)

步骤解释:

1.爬虫爬取阅读数

2.去除非法字符装入新的数组

3.设置横轴数据,生成柱状图

4.在当前目录下生成render.html,打开查看柱状图

结果:

Python爬虫爬取博客实现可视化过程解析

柱状图是动态的,不是静态的

Python爬虫爬取博客实现可视化过程解析

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
以Flask为例讲解Python的框架的使用方法
Apr 29 Python
python实现颜色空间转换程序(Tkinter)
Dec 31 Python
python django 实现验证码的功能实例代码
May 18 Python
详解Python map函数及Python map()函数的用法
Nov 16 Python
pandas series序列转化为星期几的实例
Apr 11 Python
NumPy.npy与pandas DataFrame的实例讲解
Jul 09 Python
python散点图实例之随机漫步
Aug 27 Python
pthon贪吃蛇游戏详细代码
Jan 27 Python
python文字转语音的实例代码分析
Nov 12 Python
Django基于客户端下载文件实现方法
Apr 21 Python
Django Auth用户认证组件实现代码
Oct 13 Python
Python IO文件管理的具体使用
Mar 20 Python
使用keras框架cnn+ctc_loss识别不定长字符图片操作
Jun 29 #Python
浅谈keras中的后端backend及其相关函数(K.prod,K.cast)
Jun 29 #Python
如何使用python记录室友的抖音在线时间
Jun 29 #Python
Python sublime安装及配置过程详解
Jun 29 #Python
keras K.function获取某层的输出操作
Jun 29 #Python
Python pytesseract验证码识别库用法解析
Jun 29 #Python
用Python开发app后端有优势吗
Jun 29 #Python
You might like
《PHP编程最快明白》第四讲:日期、表单接收、session、cookie
2010/11/01 PHP
CodeIgniter中实现泛域名解析
2014/07/19 PHP
php读取目录及子目录下所有文件名的方法
2014/10/20 PHP
推荐一款MAC OS X 下php集成开发环境mamp
2014/11/08 PHP
Windows平台PHP+IECapt实现网页批量截图并创建缩略图功能详解
2019/08/02 PHP
javascript Select标记中options操作方法集合
2008/10/22 Javascript
JS去除数组重复值的五种不同方法
2013/09/06 Javascript
用box固定长宽实现图片自动轮播js代码
2014/06/09 Javascript
Nodejs学习笔记之NET模块
2015/01/13 NodeJs
JavaScript分页功能的实现方法
2015/04/25 Javascript
jQuery+HTML5实现手机摇一摇换衣特效
2015/06/05 Javascript
JavaScript中的this关键字使用详解
2015/08/14 Javascript
iframe中子父类窗口调用JS的方法及注意事项
2015/08/25 Javascript
第一次接触神奇的Bootstrap网格系统
2016/07/27 Javascript
js简单时间比较的方法
2016/08/02 Javascript
AngularJS入门教程之数据绑定原理详解
2016/11/02 Javascript
Bootstrap弹出框modal上层的输入框不能获得焦点问题的解决方法
2016/12/13 Javascript
JavaScript Ajax实现异步通信
2016/12/14 Javascript
js遍历获取表格内数据的方法(必看)
2017/04/06 Javascript
深入探究angular2 UI组件之primeNG用法
2017/07/26 Javascript
微信小程序实现美团菜单
2018/06/06 Javascript
详细教你微信公众号正文页SVG交互开发技巧
2019/07/25 Javascript
[12:29]《一刀刀一天》之DOTA全时刻19:蝙蝠骑士田伯光再度不举
2014/06/10 DOTA
Python 内置函数memoryview(obj)的具体用法
2017/11/23 Python
详解Python在七牛云平台的应用(一)
2017/12/05 Python
python生成n个元素的全组合方法
2018/11/13 Python
Django实现WebSSH操作物理机或虚拟机的方法
2019/11/06 Python
Python使用type动态创建类操作示例
2020/02/29 Python
房地产营销策划方案
2014/02/08 职场文书
大学生在校表现评语
2014/12/31 职场文书
银行客户经理岗位职责
2015/04/09 职场文书
产品调价通知函
2015/04/20 职场文书
签约仪式致辞
2015/07/30 职场文书
《法国号》教学反思
2016/02/22 职场文书
Python使用random模块实现掷骰子游戏的示例代码
2021/04/29 Python
Mongo服务重启异常问题的处理方法
2021/07/01 MongoDB