Python爬虫分析微博热搜关键词的实现代码


Posted in Python onFebruary 22, 2021

1,使用到的第三方库
requests
BeautifulSoup 美味汤
worldcloud 词云
jieba 中文分词
matplotlib 绘图
2,代码实现部分

import requests
import wordcloud
import jieba
from bs4 import BeautifulSoup
from matplotlib import pyplot as plt
from pylab import mpl

#设置字体
mpl.rcParams['font.sans-serif'] = ['SimHei']
mpl.rcParams['axes.unicode_minus'] = False

url = 'https://s.weibo.com/top/summary?Refer=top_hot&topnav=1&wvr=6'

try:
  #获取数据
  r = requests.get(url)
  r.raise_for_status()
  r.encoding = r.apparent_encoding
  soup = BeautifulSoup(r.text,'html.parser')
  data = soup.find_all('a')
  d_list = []
  for item in data:
    d_list.append(item.text)
  words = d_list[4:-11:]
  #中文分词
  result = list(jieba.cut(words[0]))
  for word in words[1::]:
    result.extend(jieba.cut(word))
  redata = []
  for it in result:
    if len(it) <= 1:
      continue
    else:
      redata.append(it)
  result_str = ' '.join(redata)
  #输出词云图
  font = r'C:\Windows\Fonts\simhei.ttf'
  w = wordcloud.WordCloud(font_path=font,width=600,height=400)
  w.generate(result_str)
  w.to_file('微博热搜关键词词云.png')
  key = list(set(redata))
  x,y = [],[]
  #筛选数据
  for st in key:
    count = redata.count(st)
    if count <= 1:
      continue
    else:
      x.append(st)
      y.append(count)
  x.sort()
  y.sort()
  #绘制结果图
  plt.plot(x,y)
  plt.show()
except Exception as e:
  print(e)

 

3,运行结果

Python爬虫分析微博热搜关键词的实现代码
Python爬虫分析微博热搜关键词的实现代码

到此这篇关于Python爬虫分析微博热搜关键词的文章就介绍到这了,更多相关Python爬虫微博热搜内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python字典序问题实例
Sep 26 Python
Python中的ceil()方法使用教程
May 14 Python
pandas apply 函数 实现多进程的示例讲解
Apr 20 Python
python 处理微信对账单数据的实例代码
Jul 19 Python
在Python中预先初始化列表内容和长度的实现
Nov 28 Python
Python selenium爬取微博数据代码实例
May 22 Python
keras用auc做metrics以及早停实例
Jul 02 Python
Python实现随机爬山算法
Jan 29 Python
使用python求解迷宫问题的三种实现方法
Mar 17 Python
Python OpenCV超详细讲解读取图像视频和网络摄像头
Apr 02 Python
python中urllib包的网络请求教程
Apr 19 Python
PYTHON基于Pyecharts绘制常见的直角坐标系图表
Apr 28 Python
anaconda升级sklearn版本的实现方法
Feb 22 #Python
详解Python 中的 defaultdict 数据类型
Feb 22 #Python
python快速安装OpenCV的步骤记录
Feb 22 #Python
Python中生成ndarray实例讲解
Feb 22 #Python
python爬虫利用代理池更换IP的方法步骤
Feb 21 #Python
Python用requests库爬取返回为空的解决办法
Feb 21 #Python
python利用proxybroker构建爬虫免费IP代理池的实现
Feb 21 #Python
You might like
第三章 php操作符与控制结构代码
2011/12/30 PHP
七款最流行的PHP本地服务器分享
2013/02/19 PHP
js资料toString 方法
2007/03/13 Javascript
js 深拷贝函数
2008/12/04 Javascript
Javascript 获取字符串字节数的多种方法
2009/06/02 Javascript
深入理解JavaScript系列(12) 变量对象(Variable Object)
2012/01/16 Javascript
js中substring和substr的详细介绍与用法
2013/08/29 Javascript
创建js对象和js类的方法汇总
2014/12/24 Javascript
jQuery实现强制cookie过期方法汇总
2015/05/22 Javascript
jQuery设置Cookie及删除Cookie实例分析
2016/04/15 Javascript
sea.js常用的api简易文档
2016/11/15 Javascript
JS实现太极旋转思路分析
2016/12/09 Javascript
jquery实时获取时间的简单实例
2017/01/26 Javascript
nodejs动态创建二维码的方法
2017/08/12 NodeJs
基于substring()和substr()的使用以及区别(实例讲解)
2017/12/28 Javascript
微信小程序后端(java)开发流程的详细步骤
2019/11/13 Javascript
Python的设计模式编程入门指南
2015/04/02 Python
Python登录并获取CSDN博客所有文章列表代码实例
2017/12/28 Python
Python搭建代理IP池实现获取IP的方法
2019/10/27 Python
python实现图片插入文字
2019/11/26 Python
python GUI库图形界面开发之PyQt5信号与槽机制、自定义信号基础介绍
2020/02/25 Python
python矩阵运算,转置,逆运算,共轭矩阵实例
2020/05/11 Python
python爬虫智能翻页批量下载文件的实例详解
2021/02/02 Python
Html5页面内使用JSON动画的实现
2019/01/29 HTML / CSS
公积金转移接收函
2014/01/11 职场文书
我们的节日清明节活动方案
2014/03/05 职场文书
公民代理授权委托书
2014/09/24 职场文书
迎国庆横幅标语
2014/10/08 职场文书
2014保险公司个人工作总结
2014/12/09 职场文书
2015年生产部工作总结范文
2015/05/25 职场文书
2015年幼儿园班主任个人工作总结
2015/10/22 职场文书
七年级数学教学反思
2016/02/17 职场文书
个人的事迹材料怎么写
2019/04/24 职场文书
56句经典英文座右铭
2019/08/09 职场文书
缓存替换策略及应用(以Redis、InnoDB为例)
2021/07/25 Redis
JavaScript模拟实现网易云轮播效果
2022/04/04 Javascript