Python爬虫分析微博热搜关键词的实现代码


Posted in Python onFebruary 22, 2021

1,使用到的第三方库
requests
BeautifulSoup 美味汤
worldcloud 词云
jieba 中文分词
matplotlib 绘图
2,代码实现部分

import requests
import wordcloud
import jieba
from bs4 import BeautifulSoup
from matplotlib import pyplot as plt
from pylab import mpl

#设置字体
mpl.rcParams['font.sans-serif'] = ['SimHei']
mpl.rcParams['axes.unicode_minus'] = False

url = 'https://s.weibo.com/top/summary?Refer=top_hot&topnav=1&wvr=6'

try:
  #获取数据
  r = requests.get(url)
  r.raise_for_status()
  r.encoding = r.apparent_encoding
  soup = BeautifulSoup(r.text,'html.parser')
  data = soup.find_all('a')
  d_list = []
  for item in data:
    d_list.append(item.text)
  words = d_list[4:-11:]
  #中文分词
  result = list(jieba.cut(words[0]))
  for word in words[1::]:
    result.extend(jieba.cut(word))
  redata = []
  for it in result:
    if len(it) <= 1:
      continue
    else:
      redata.append(it)
  result_str = ' '.join(redata)
  #输出词云图
  font = r'C:\Windows\Fonts\simhei.ttf'
  w = wordcloud.WordCloud(font_path=font,width=600,height=400)
  w.generate(result_str)
  w.to_file('微博热搜关键词词云.png')
  key = list(set(redata))
  x,y = [],[]
  #筛选数据
  for st in key:
    count = redata.count(st)
    if count <= 1:
      continue
    else:
      x.append(st)
      y.append(count)
  x.sort()
  y.sort()
  #绘制结果图
  plt.plot(x,y)
  plt.show()
except Exception as e:
  print(e)

 

3,运行结果

Python爬虫分析微博热搜关键词的实现代码
Python爬虫分析微博热搜关键词的实现代码

到此这篇关于Python爬虫分析微博热搜关键词的文章就介绍到这了,更多相关Python爬虫微博热搜内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python函数参数*args**kwargs用法实例
Dec 04 Python
使用python实现正则匹配检索远端FTP目录下的文件
Mar 25 Python
Python实现JSON反序列化类对象的示例
Jan 31 Python
python 读取dicom文件,生成info.txt和raw文件的方法
Jan 24 Python
python实现一个简单的ping工具方法
Jan 31 Python
Python基础之循环语句用法示例【for、while循环】
Mar 23 Python
Python安装及Pycharm安装使用教程图解
Sep 20 Python
Python序列化pickle模块使用详解
Mar 05 Python
django日志默认打印request请求信息的方法示例
May 17 Python
什么是Python中的顺序表
Jun 02 Python
python3爬虫中多线程的优势总结
Nov 24 Python
python实战之用emoji表情生成文字
May 08 Python
anaconda升级sklearn版本的实现方法
Feb 22 #Python
详解Python 中的 defaultdict 数据类型
Feb 22 #Python
python快速安装OpenCV的步骤记录
Feb 22 #Python
Python中生成ndarray实例讲解
Feb 22 #Python
python爬虫利用代理池更换IP的方法步骤
Feb 21 #Python
Python用requests库爬取返回为空的解决办法
Feb 21 #Python
python利用proxybroker构建爬虫免费IP代理池的实现
Feb 21 #Python
You might like
献给php初学者(入门学习经验谈)
2010/10/12 PHP
php文件操作实例代码
2012/05/10 PHP
使用array_map简单搞定PHP删除文件、删除目录
2014/10/29 PHP
php中stdClass的用法分析
2015/02/27 PHP
ThinkPHP框架实现的MySQL数据库备份功能示例
2018/05/24 PHP
Laravel统一错误处理为JSON的方法介绍
2020/10/18 PHP
你真的了解JavaScript吗?
2007/02/24 Javascript
qTip 基于JQuery的Tooltip插件[兼容性好]
2010/09/01 Javascript
JS Replace 全部替换字符的用法小结
2013/12/24 Javascript
JavaScript实现班级随机点名小应用需求的具体分析
2014/05/12 Javascript
Thinkphp模板没有解析直接原样输出的解决方法
2014/10/31 Javascript
JS实现的网页倒计时数字时钟效果
2015/03/02 Javascript
js实现完美兼容各大浏览器的人民币大小写相互转换
2015/10/29 Javascript
jQuery实现点击行选中或取消CheckBox的方法
2016/08/01 Javascript
BootStrap使用file-input插件上传图片的方法
2016/09/05 Javascript
基于Bootstrap实现城市三级联动
2017/11/23 Javascript
基于zTree树形菜单的使用实例
2017/12/25 Javascript
JavaScript设计模式之职责链模式应用示例
2018/08/07 Javascript
菊花转动的jquery加载动画效果
2018/08/19 jQuery
vue + axios get下载文件功能
2019/09/25 Javascript
vue实现节点增删改功能
2019/09/26 Javascript
el-table树形表格表单验证(列表生成序号)
2020/05/31 Javascript
从零学python系列之从文件读取和保存数据
2014/05/23 Python
Python中列表的一些基本操作知识汇总
2015/05/20 Python
python实现中文转换url编码的方法
2016/06/14 Python
Python使用sort和class实现的多级排序功能示例
2018/08/15 Python
python使用matplotlib库生成随机漫步图
2018/08/27 Python
python实现对任意大小图片均匀切割的示例
2018/12/05 Python
Python图像处理实现两幅图像合成一幅图像的方法【测试可用】
2019/01/04 Python
python中的单引号双引号区别知识点总结
2019/06/23 Python
python matplotlib 画dataframe的时间序列图实例
2019/11/20 Python
详解Python中Pyyaml模块的使用
2020/10/08 Python
小学生暑假感言
2014/02/06 职场文书
酒店员工管理制度
2015/08/05 职场文书
优秀的商业计划书,让融资一步到位
2019/05/07 职场文书
「玫瑰之王的葬礼」舞台剧主视觉图公开
2022/03/21 日漫