Python爬虫分析微博热搜关键词的实现代码


Posted in Python onFebruary 22, 2021

1,使用到的第三方库
requests
BeautifulSoup 美味汤
worldcloud 词云
jieba 中文分词
matplotlib 绘图
2,代码实现部分

import requests
import wordcloud
import jieba
from bs4 import BeautifulSoup
from matplotlib import pyplot as plt
from pylab import mpl

#设置字体
mpl.rcParams['font.sans-serif'] = ['SimHei']
mpl.rcParams['axes.unicode_minus'] = False

url = 'https://s.weibo.com/top/summary?Refer=top_hot&topnav=1&wvr=6'

try:
  #获取数据
  r = requests.get(url)
  r.raise_for_status()
  r.encoding = r.apparent_encoding
  soup = BeautifulSoup(r.text,'html.parser')
  data = soup.find_all('a')
  d_list = []
  for item in data:
    d_list.append(item.text)
  words = d_list[4:-11:]
  #中文分词
  result = list(jieba.cut(words[0]))
  for word in words[1::]:
    result.extend(jieba.cut(word))
  redata = []
  for it in result:
    if len(it) <= 1:
      continue
    else:
      redata.append(it)
  result_str = ' '.join(redata)
  #输出词云图
  font = r'C:\Windows\Fonts\simhei.ttf'
  w = wordcloud.WordCloud(font_path=font,width=600,height=400)
  w.generate(result_str)
  w.to_file('微博热搜关键词词云.png')
  key = list(set(redata))
  x,y = [],[]
  #筛选数据
  for st in key:
    count = redata.count(st)
    if count <= 1:
      continue
    else:
      x.append(st)
      y.append(count)
  x.sort()
  y.sort()
  #绘制结果图
  plt.plot(x,y)
  plt.show()
except Exception as e:
  print(e)

 

3,运行结果

Python爬虫分析微博热搜关键词的实现代码
Python爬虫分析微博热搜关键词的实现代码

到此这篇关于Python爬虫分析微博热搜关键词的文章就介绍到这了,更多相关Python爬虫微博热搜内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
Python脚本获取操作系统版本信息
Dec 17 Python
Python编程之微信推送模板消息功能示例
Aug 21 Python
Python将图片转换为字符画的方法
Jun 16 Python
Python 爬取携程所有机票的实例代码
Jun 11 Python
在python中实现将一张图片剪切成四份的方法
Dec 05 Python
对Python3中dict.keys()转换成list类型的方法详解
Feb 03 Python
Python socket模块实现的udp通信功能示例
Apr 10 Python
Python math库 ln(x)运算的实现及原理
Jul 17 Python
简单分析python的类变量、实例变量
Aug 23 Python
Python 、Pycharm、Anaconda三者的区别与联系、安装过程及注意事项
Oct 11 Python
使用PyCharm进行远程开发和调试的实现
Nov 04 Python
Python中zipfile压缩包模块的使用
May 14 Python
anaconda升级sklearn版本的实现方法
Feb 22 #Python
详解Python 中的 defaultdict 数据类型
Feb 22 #Python
python快速安装OpenCV的步骤记录
Feb 22 #Python
Python中生成ndarray实例讲解
Feb 22 #Python
python爬虫利用代理池更换IP的方法步骤
Feb 21 #Python
Python用requests库爬取返回为空的解决办法
Feb 21 #Python
python利用proxybroker构建爬虫免费IP代理池的实现
Feb 21 #Python
You might like
PHP数字格式化
2006/12/06 PHP
解析PHP中如何将数组变量写入文件
2013/06/06 PHP
PHP 面向对象程序设计(oop)学习笔记 (五) - PHP 命名空间
2014/06/12 PHP
ThinkPHP的SAE开发相关注意事项详解
2016/10/09 PHP
PHP实现求连续子数组最大和问题2种解决方法
2017/12/26 PHP
PHP使用星号替代用户名手机和邮箱的实现代码
2018/02/07 PHP
javascript自定义in_array()函数实现方法
2015/08/03 Javascript
jquery实现左右滑动菜单效果代码
2015/08/27 Javascript
简单实现IONIC购物车功能
2017/01/10 Javascript
jQuery插件JWPlayer视频播放器用法实例分析
2017/01/11 Javascript
解决webpack打包速度慢的解决办法汇总
2017/07/06 Javascript
BootStrap点击保存后实现模态框自动关闭的思路(模态框)
2017/09/26 Javascript
webpack4 css打包压缩问题的解决
2018/05/18 Javascript
JavaScript实现封闭区域布尔运算的示例代码
2018/06/25 Javascript
js实现图片放大并跟随鼠标移动特效
2019/01/18 Javascript
js使用文件流下载csv文件的实现方法
2019/07/15 Javascript
微信小程序定义和调用全局变量globalData的实现
2019/11/01 Javascript
[05:13]2018DOTA2亚洲邀请赛主赛事第二日战况回顾 LGD、VG双雄携手晋级
2018/04/05 DOTA
python 日期操作类代码
2018/05/05 Python
解决Python pandas df 写入excel 出现的问题
2018/07/04 Python
详解flask入门模板引擎
2018/07/18 Python
python实现词法分析器
2019/01/31 Python
python文件读取失败怎么处理
2020/06/23 Python
用html5的canvas画布绘制贝塞尔曲线完整代码
2013/08/14 HTML / CSS
HTML5实现的图片无限加载的瀑布流效果另带边框圆角阴影
2014/03/07 HTML / CSS
ALEX AND ANI:手镯,项链,耳环和更多
2017/04/20 全球购物
德国家具折扣店:POCO
2020/02/28 全球购物
shell程序中如何注释
2012/02/17 面试题
服务中心夜班服务员岗位职责
2013/11/27 职场文书
高中考试作弊检讨书
2014/01/14 职场文书
安全月活动总结
2014/05/05 职场文书
2015年小学总务工作总结
2015/07/21 职场文书
学校远程教育工作总结
2015/08/11 职场文书
导游词之太湖
2019/10/08 职场文书
Python访问Redis的详细操作
2021/06/26 Python
Windows10安装Apache2.4的方法步骤
2022/06/25 Servers