Python爬虫分析微博热搜关键词的实现代码


Posted in Python onFebruary 22, 2021

1,使用到的第三方库
requests
BeautifulSoup 美味汤
worldcloud 词云
jieba 中文分词
matplotlib 绘图
2,代码实现部分

import requests
import wordcloud
import jieba
from bs4 import BeautifulSoup
from matplotlib import pyplot as plt
from pylab import mpl

#设置字体
mpl.rcParams['font.sans-serif'] = ['SimHei']
mpl.rcParams['axes.unicode_minus'] = False

url = 'https://s.weibo.com/top/summary?Refer=top_hot&topnav=1&wvr=6'

try:
  #获取数据
  r = requests.get(url)
  r.raise_for_status()
  r.encoding = r.apparent_encoding
  soup = BeautifulSoup(r.text,'html.parser')
  data = soup.find_all('a')
  d_list = []
  for item in data:
    d_list.append(item.text)
  words = d_list[4:-11:]
  #中文分词
  result = list(jieba.cut(words[0]))
  for word in words[1::]:
    result.extend(jieba.cut(word))
  redata = []
  for it in result:
    if len(it) <= 1:
      continue
    else:
      redata.append(it)
  result_str = ' '.join(redata)
  #输出词云图
  font = r'C:\Windows\Fonts\simhei.ttf'
  w = wordcloud.WordCloud(font_path=font,width=600,height=400)
  w.generate(result_str)
  w.to_file('微博热搜关键词词云.png')
  key = list(set(redata))
  x,y = [],[]
  #筛选数据
  for st in key:
    count = redata.count(st)
    if count <= 1:
      continue
    else:
      x.append(st)
      y.append(count)
  x.sort()
  y.sort()
  #绘制结果图
  plt.plot(x,y)
  plt.show()
except Exception as e:
  print(e)

 

3,运行结果

Python爬虫分析微博热搜关键词的实现代码
Python爬虫分析微博热搜关键词的实现代码

到此这篇关于Python爬虫分析微博热搜关键词的文章就介绍到这了,更多相关Python爬虫微博热搜内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
利用python爬取软考试题之ip自动代理
Mar 28 Python
Python字典实现简单的三级菜单(实例讲解)
Jul 31 Python
python中datetime模块中strftime/strptime函数的使用
Jul 03 Python
Python3.7实现中控考勤机自动连接
Aug 28 Python
Python初学者需要注意的事项小结(python2与python3)
Sep 26 Python
解析python实现Lasso回归
Sep 11 Python
Python 面向对象之封装、继承、多态操作实例分析
Nov 21 Python
python加载自定义词典实例
Dec 06 Python
pandas使用之宽表变窄表的实现
Apr 12 Python
Pyinstaller 打包发布经验总结
Jun 02 Python
python音频处理的示例详解
Dec 23 Python
Python OpenCV 图像平移的实现示例
Jun 04 Python
anaconda升级sklearn版本的实现方法
Feb 22 #Python
详解Python 中的 defaultdict 数据类型
Feb 22 #Python
python快速安装OpenCV的步骤记录
Feb 22 #Python
Python中生成ndarray实例讲解
Feb 22 #Python
python爬虫利用代理池更换IP的方法步骤
Feb 21 #Python
Python用requests库爬取返回为空的解决办法
Feb 21 #Python
python利用proxybroker构建爬虫免费IP代理池的实现
Feb 21 #Python
You might like
php实现读取超大文件的方法
2014/07/28 PHP
php实现singleton()单例模式实例
2014/11/06 PHP
使用PHPExcel实现数据批量导出为excel表格的方法(必看)
2017/06/09 PHP
JQuery实现的在新窗口打开链接的方法小结
2010/04/22 Javascript
一个判断抢购时间是否到达的简单的js函数
2014/06/23 Javascript
JS简单实现城市二级联动选择插件的方法
2015/08/19 Javascript
HTML5+jQuery插件Quicksand实现超酷的星际争霸2兵种分类展示效果(附demo源码下载)
2016/05/25 Javascript
高效Web开发的10个jQuery代码片段
2016/07/22 Javascript
pc加载更多功能和移动端下拉刷新加载数据
2016/11/07 Javascript
COM组件中调用JavaScript函数详解及实例
2017/02/23 Javascript
jQuery操作css样式
2017/05/15 jQuery
axios拦截设置和错误处理方法
2018/03/05 Javascript
vue2.x集成百度UEditor富文本编辑器的方法
2018/09/21 Javascript
jQuery Ajax实现Select多级关联动态绑定数据的实例代码
2018/10/26 jQuery
vue transition 在子组件中失效的解决
2019/11/12 Javascript
jQuery实现增删改查
2020/12/22 jQuery
[04:15]DOTA2-DPC中国联赛 正赛 Ehome vs Aster 选手采访
2021/03/11 DOTA
Python 命令行非阻塞输入的小例子
2013/09/27 Python
Python中使用Beautiful Soup库的超详细教程
2015/04/30 Python
在Python的Flask中使用WTForms表单框架的基础教程
2016/06/07 Python
Python进行数据提取的方法总结
2016/08/22 Python
python使用for循环计算0-100的整数的和方法
2019/02/01 Python
Python发展简史 Python来历
2019/05/14 Python
python 动态调用函数实例解析
2019/10/21 Python
Django中使用MySQL5.5的教程
2019/12/18 Python
Python中如何引入第三方模块
2020/05/27 Python
HTML5 Canvas像素处理使用接口介绍
2012/12/02 HTML / CSS
选购世界上最好的美妆品:Cult Beauty
2017/11/03 全球购物
物业招聘计划书
2014/01/10 职场文书
计算机毕业生自荐信范文
2014/03/23 职场文书
毕业生欢送会主持词
2014/03/31 职场文书
中秋晚会策划方案
2014/06/12 职场文书
学院党的群众路线教育实践活动第一阶段情况汇报
2014/10/25 职场文书
婚宴新郎致辞
2015/07/28 职场文书
《童年的发现》教学反思
2016/02/18 职场文书
创业计划书之儿童理发店
2019/09/27 职场文书