基于Python词云分析政府工作报告关键词


Posted in Python onJune 02, 2020

前言

十三届全国人大三次会议作了政府工作报告。这份政府工作报告仅有10500字左右,据悉是改革开放40年以来最短的一次。受到疫情影响,今年的两会会议适当缩短,政府工作报告也大幅压缩,体现了“实干为要”的理念。那么,这份政府工作报告突出强调了哪些关键词呢?我们其实可以基于Python技术进行词频分析和词云制作!

import matplotlib.pyplot as plt#绘图库
import jieba
from wordcloud import WordCloud

# 读入文本数据
fp = open(r'D:\爬虫下载\2020年政府工作报告.txt','r',encoding='utf-8')
content = fp.read()
# print(content)
#分词
words = jieba.lcut(content)
# 词频分析操作
data = {}
for word in words:
  if len(word)>1:
    if word in data:
      data[word]+=1
    else:
      data[word]=1
# print(data)

#排序
hist = list(data.items())#转成列表
hist.sort(key=lambda x:x[1],reverse=True)
# print(hist)

#调试输出
for i in range(20):
  # print(hist[i])
  print('{:<10}{:>5}'.format(hist[i][0],hist[i][1]))#左对齐10,右对齐5个长度

下表统计了今年的政府工作报告中出现次数最多的几个关键词。我们可以看到,今年的政府工作报告中提到“发展”的次数最多,一共出现了69次,“发展”一直都是政府工作报告中的重要关键词;其次是“就业”,出现了39次,足以显示新冠疫情之下就业问题的严峻性,以及党中央、国务院对就业问题的高度重视,政府工作报告中没有提出全年经济增速的具体目标,但仍然提出了就业目标——城镇新增就业900万人以上、城镇调查失业率6%左右、城镇登记失业率5.5%左右;第三多的就是“疫情”,报告中多次提到疫情防控工作,并指出这次新冠肺炎疫情,是新中国成立以来我国遭遇的传播速度最快、感染范围最广、防控难度最大的公共卫生事件。

基于Python词云分析政府工作报告关键词

“企业”作为市场经济的主体,出现的次数达到了30次,要想保障就业和民生,必须稳住上亿市场主体,尽力帮助企业特别是中小微企业、个体工商户渡过难关,报告提出要加大宏观政策实施力度,着力稳企业保就业。还有“支持”、“保障”、“加强”、“推进”等鼓舞人心的关键词出现次数也很多,相信大家看到政府工作报告中满满的政策“干货”,信心和底气也会更足了。

根据关键词的出现次数,我们可以使用Python绘制出政府工作报告词云图。Python的词云功能相当强大,你可以自己设定形状、字体、大小!

result = ' '.join(words)
# print(result)
#生成词云
wc = WordCloud(
  font_path=r'D:\PPT\ppt字体\思源宋体SC-Regular.otf',
  background_color = 'white',#背景颜色
  width=500,#图片的宽
  height=300,
  max_font_size=50,
  min_font_size=12
)
wc.generate(result)
wc.to_file(r'.\wordcloud.png')#保存图片
#显示图片
plt.figure('政府工作报告')
plt.imshow(wc)
plt.axis('off')#关闭坐标轴
plt.show()

基于Python词云分析政府工作报告关键词

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python爬取淘宝商品详情页数据
Feb 23 Python
pandas string转dataframe的方法
Apr 11 Python
python 将列表中的字符串连接成一个长路径的方法
Oct 23 Python
通过Python编写一个简单登录功能过程解析
Sep 04 Python
决策树剪枝算法的python实现方法详解
Sep 18 Python
python基于socket实现的UDP及TCP通讯功能示例
Nov 01 Python
python绘制无向图度分布曲线示例
Nov 22 Python
python实现PCA降维的示例详解
Feb 24 Python
解决Python中报错TypeError: must be str, not bytes问题
Apr 07 Python
python小白切忌乱用表达式
May 29 Python
Python入门之使用pandas分析excel数据
May 12 Python
Python自动操作神器PyAutoGUI的使用教程
Jun 16 Python
使用OpenCV获取图像某点的颜色值,并设置某点的颜色
Jun 02 #Python
如何利用python web框架做文件流下载的实现示例
Jun 02 #Python
python3+opencv 使用灰度直方图来判断图片的亮暗操作
Jun 02 #Python
Java多线程实现四种方式原理详解
Jun 02 #Python
Python+Kepler.gl轻松制作酷炫路径动画的实现示例
Jun 02 #Python
opencv+python实现鼠标点击图像,输出该点的RGB和HSV值
Jun 02 #Python
简单介绍一下pyinstaller打包以及安全性的实现
Jun 02 #Python
You might like
ThinkPHP中ajax使用实例教程
2014/08/22 PHP
php返回json数据函数实例
2014/10/09 PHP
php经典算法集锦
2015/11/14 PHP
老鱼 浅谈javascript面向对象编程
2010/03/04 Javascript
js判断数据类型如判断是否为数组是否为字符串等等
2014/01/15 Javascript
用JS在浏览器中创建下载文件
2014/03/05 Javascript
简单的js图片轮换代码(js图片轮播)
2014/05/06 Javascript
javascript实现超炫的向上滑行菜单实例
2015/08/03 Javascript
jQuery on()方法绑定动态元素的点击事件无响应的解决办法
2016/07/07 Javascript
jQuery html表格排序插件tablesorter使用方法详解
2017/02/10 Javascript
js实现导航吸顶效果
2017/02/24 Javascript
原生JS实现顶部导航栏显示按钮+搜索框功能
2019/12/25 Javascript
vue 内联样式style中的background用法说明
2020/08/05 Javascript
采用Psyco实现python执行速度提高到与编译语言一样的水平
2014/10/11 Python
Python的Django中django-userena组件的简单使用教程
2015/05/30 Python
Linux 发邮件磁盘空间监控(python)
2016/04/23 Python
浅谈python numpy中nonzero()的用法
2018/04/02 Python
pytorch构建网络模型的4种方法
2018/04/13 Python
Python基于jieba库进行简单分词及词云功能实现方法
2018/06/16 Python
Python  unittest单元测试框架的使用
2018/09/08 Python
Python concurrent.futures模块使用实例
2019/12/24 Python
pytorch 指定gpu训练与多gpu并行训练示例
2019/12/31 Python
PyTorch加载预训练模型实例(pretrained)
2020/01/17 Python
django的模型类管理器——数据库操作的封装详解
2020/04/01 Python
Python实现自动签到脚本的示例代码
2020/08/19 Python
南京某软件公司的.net面试题
2015/11/30 面试题
高三地理教学反思
2014/01/11 职场文书
中学生期末评语
2014/02/03 职场文书
四风查摆问题自查报告
2014/10/10 职场文书
食堂卫生管理制度
2015/08/04 职场文书
服装店员工管理制度
2015/08/07 职场文书
幼儿园语言教学反思
2016/02/23 职场文书
Go缓冲channel和非缓冲channel的区别说明
2021/04/25 Golang
Python如何配置环境变量详解
2021/05/18 Python
mysql获取指定时间段中所有日期或月份的语句(不设存储过程,不加表)
2021/06/18 MySQL
Nginx实现会话保持的两种方式
2022/03/18 Servers