Python爬虫爬取博客实现可视化过程解析


Posted in Python onJune 29, 2020

源码:

from pyecharts import Bar
import re
import requests
num=0
b=[]
for i in range(1,11):
  link='https://www.cnblogs.com/echoDetected/default.html?page='+str(i)
  headers={'user-agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/72.0.3626.109 Safari/537.36'}
  r=requests.get(link,headers=headers)
  html=r.text
  post=re.findall('<span class="post-view-count">(.*?)</span>',html)
for i in post:
    i = i.replace("阅读(", "")
    i = i.replace(")","")
    b.append(i)
    num=num+1
columns=[]
for i in range(1,num+1):
#设置行名
  columns.append('博客'+str(i))
#设置数据
#设置柱状图的主标题与副标题
bar = Bar("柱状图", "每个博客阅读数量")
#添加柱状图的数据及配置项,先行后列
bar.add("阅读量", columns, b, mark_line=["average"], mark_point=["max", "min"])
#生成本地文件(默认为.html文件)
bar.render()

爬虫不是重点,只是拿来爬阅读数量,pyecharts是重点

这次爬的是我自己的博客,一共10页,每页10片文章,正好写了100篇博客

pyecharts安装:

pip install wheelpip install pyecharts==0.1.9.4

直接pip install pyecharts会下载最新版无法调用

注意点:pyecharts调用,貌似无法实现多个py文件一起调用(意思是编写时不能在多个文件里出现import语句)

步骤解释:

1.爬虫爬取阅读数

2.去除非法字符装入新的数组

3.设置横轴数据,生成柱状图

4.在当前目录下生成render.html,打开查看柱状图

结果:

Python爬虫爬取博客实现可视化过程解析

柱状图是动态的,不是静态的

Python爬虫爬取博客实现可视化过程解析

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python模拟登陆Tom邮箱示例分享
Jan 13 Python
Python正则表达式匹配ip地址实例
Oct 09 Python
简单谈谈Python中的元祖(Tuple)和字典(Dict)
Apr 21 Python
Python Xml文件添加字节属性的方法
Mar 31 Python
pymongo中聚合查询的使用方法
Mar 22 Python
Python3.5装饰器原理及应用实例详解
Apr 30 Python
Python 3 实现定义跨模块的全局变量和使用教程
Jul 07 Python
Django应用程序入口WSGIHandler源码解析
Aug 05 Python
python 读取数据库并绘图的实例
Dec 03 Python
python判断变量是否为int、字符串、列表、元组、字典的方法详解
Feb 13 Python
Python中使用ipython的详细教程
Jun 22 Python
Python django中如何使用restful框架
Jun 23 Python
使用keras框架cnn+ctc_loss识别不定长字符图片操作
Jun 29 #Python
浅谈keras中的后端backend及其相关函数(K.prod,K.cast)
Jun 29 #Python
如何使用python记录室友的抖音在线时间
Jun 29 #Python
Python sublime安装及配置过程详解
Jun 29 #Python
keras K.function获取某层的输出操作
Jun 29 #Python
Python pytesseract验证码识别库用法解析
Jun 29 #Python
用Python开发app后端有优势吗
Jun 29 #Python
You might like
3个PHP多维数组转为一维数组的方法实例
2014/03/13 PHP
php求两个目录的相对路径示例(php获取相对路径)
2014/03/27 PHP
CI(CodeIgniter)框架介绍
2014/06/09 PHP
PHP中字符串长度的截取用法示例
2017/01/12 PHP
Yii2框架实现登陆添加验证码功能示例
2018/07/12 PHP
jquery 查找select ,并触发事件的实现代码
2011/03/30 Javascript
统计jQuery中各字符串出现次数的工具
2012/05/03 Javascript
Bootstrap按钮组件详解
2016/04/26 Javascript
JS原型对象的创建方法详解
2016/06/16 Javascript
VUE JS 使用组件实现双向绑定的示例代码
2017/01/10 Javascript
Kotlin学习第一步 kotlin语法特性
2017/05/25 Javascript
如何用input标签和jquery实现多图片的上传和回显功能
2018/05/16 jQuery
使用jQuery给Table动态增加行、清空table的方法
2018/09/05 jQuery
react koa rematch 如何打造一套服务端渲染架子
2019/06/26 Javascript
基于Vue中使用节流Lodash throttle详解
2019/10/30 Javascript
Vue 请求传公共参数的操作
2020/07/31 Javascript
前端性能优化建议
2020/09/17 Javascript
python动态加载包的方法小结
2016/04/18 Python
Centos Python2 升级到Python3的简单实现
2016/06/21 Python
Python中关键字nonlocal和global的声明与解析
2017/03/12 Python
Python大数据之网络爬虫的post请求、get请求区别实例分析
2019/11/16 Python
python求解汉诺塔游戏
2020/07/09 Python
QT5 Designer 打不开的问题及解决方法
2020/08/20 Python
Python基于爬虫实现全网搜索并下载音乐
2021/02/14 Python
HTML5+CSS3网页加载进度条的实现,下载进度条的代码实例
2016/12/30 HTML / CSS
Html5 localStorage入门教程
2018/04/26 HTML / CSS
创造美妙香氛体验:Aera扩散器和香水
2018/11/25 全球购物
海蓝之谜英国官网:La Mer英国
2020/01/15 全球购物
心理学专业毕业生推荐信范文
2013/11/21 职场文书
安全责任书范本
2014/04/15 职场文书
快餐公司创业计划书
2014/04/29 职场文书
化学专业自荐信
2014/05/28 职场文书
2014领导班子正风肃纪思想汇报
2014/09/18 职场文书
个人公司授权委托书范本
2014/10/12 职场文书
慈善献爱心倡议书
2015/04/27 职场文书
大学生干部培训心得体会
2016/01/06 职场文书