基于Python词云分析政府工作报告关键词


Posted in Python onJune 02, 2020

前言

十三届全国人大三次会议作了政府工作报告。这份政府工作报告仅有10500字左右,据悉是改革开放40年以来最短的一次。受到疫情影响,今年的两会会议适当缩短,政府工作报告也大幅压缩,体现了“实干为要”的理念。那么,这份政府工作报告突出强调了哪些关键词呢?我们其实可以基于Python技术进行词频分析和词云制作!

import matplotlib.pyplot as plt#绘图库
import jieba
from wordcloud import WordCloud

# 读入文本数据
fp = open(r'D:\爬虫下载\2020年政府工作报告.txt','r',encoding='utf-8')
content = fp.read()
# print(content)
#分词
words = jieba.lcut(content)
# 词频分析操作
data = {}
for word in words:
  if len(word)>1:
    if word in data:
      data[word]+=1
    else:
      data[word]=1
# print(data)

#排序
hist = list(data.items())#转成列表
hist.sort(key=lambda x:x[1],reverse=True)
# print(hist)

#调试输出
for i in range(20):
  # print(hist[i])
  print('{:<10}{:>5}'.format(hist[i][0],hist[i][1]))#左对齐10,右对齐5个长度

下表统计了今年的政府工作报告中出现次数最多的几个关键词。我们可以看到,今年的政府工作报告中提到“发展”的次数最多,一共出现了69次,“发展”一直都是政府工作报告中的重要关键词;其次是“就业”,出现了39次,足以显示新冠疫情之下就业问题的严峻性,以及党中央、国务院对就业问题的高度重视,政府工作报告中没有提出全年经济增速的具体目标,但仍然提出了就业目标——城镇新增就业900万人以上、城镇调查失业率6%左右、城镇登记失业率5.5%左右;第三多的就是“疫情”,报告中多次提到疫情防控工作,并指出这次新冠肺炎疫情,是新中国成立以来我国遭遇的传播速度最快、感染范围最广、防控难度最大的公共卫生事件。

基于Python词云分析政府工作报告关键词

“企业”作为市场经济的主体,出现的次数达到了30次,要想保障就业和民生,必须稳住上亿市场主体,尽力帮助企业特别是中小微企业、个体工商户渡过难关,报告提出要加大宏观政策实施力度,着力稳企业保就业。还有“支持”、“保障”、“加强”、“推进”等鼓舞人心的关键词出现次数也很多,相信大家看到政府工作报告中满满的政策“干货”,信心和底气也会更足了。

根据关键词的出现次数,我们可以使用Python绘制出政府工作报告词云图。Python的词云功能相当强大,你可以自己设定形状、字体、大小!

result = ' '.join(words)
# print(result)
#生成词云
wc = WordCloud(
  font_path=r'D:\PPT\ppt字体\思源宋体SC-Regular.otf',
  background_color = 'white',#背景颜色
  width=500,#图片的宽
  height=300,
  max_font_size=50,
  min_font_size=12
)
wc.generate(result)
wc.to_file(r'.\wordcloud.png')#保存图片
#显示图片
plt.figure('政府工作报告')
plt.imshow(wc)
plt.axis('off')#关闭坐标轴
plt.show()

基于Python词云分析政府工作报告关键词

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python实现JSON反序列化类对象的示例
Jan 31 Python
python单例模式实例解析
Aug 28 Python
Python对excel文档的操作方法详解
Dec 10 Python
Python图像处理之颜色的定义与使用分析
Jan 03 Python
python basemap 画出经纬度并标定的实例
Jul 09 Python
tensorflow实现打印ckpt模型保存下的变量名称及变量值
Jan 04 Python
将labelme格式数据转化为标准的coco数据集格式方式
Feb 17 Python
django 取消csrf限制的实例
Mar 13 Python
Python socket连接中的粘包、精确传输问题实例分析
Mar 24 Python
如何在Python 游戏中模拟引力
Mar 27 Python
Python基于pandas绘制散点图矩阵代码实例
Jun 04 Python
python编写五子棋游戏
May 25 Python
使用OpenCV获取图像某点的颜色值,并设置某点的颜色
Jun 02 #Python
如何利用python web框架做文件流下载的实现示例
Jun 02 #Python
python3+opencv 使用灰度直方图来判断图片的亮暗操作
Jun 02 #Python
Java多线程实现四种方式原理详解
Jun 02 #Python
Python+Kepler.gl轻松制作酷炫路径动画的实现示例
Jun 02 #Python
opencv+python实现鼠标点击图像,输出该点的RGB和HSV值
Jun 02 #Python
简单介绍一下pyinstaller打包以及安全性的实现
Jun 02 #Python
You might like
历史证明,懒惰才是推动科学发展技术进步的动力
2021/03/02 无线电
PHP脚本的10个技巧(4)
2006/10/09 PHP
PHP实现无限极分类图文教程
2014/11/25 PHP
浅谈php错误提示及查错方法
2015/07/14 PHP
PHP实现字符串的全排列详解
2019/04/24 PHP
php 实现银联商务H5支付的示例代码
2019/10/12 PHP
用JQuery在网页中实现分隔条功能的代码
2012/08/09 Javascript
图片无缝滚动代码(向左/向下/向上)
2013/04/10 Javascript
不同Jquery版本引发的问题解决
2013/10/14 Javascript
JavaScript打印网页指定区域的例子
2014/05/03 Javascript
javascript 闭包详解
2015/07/02 Javascript
javascript+HTML5的canvas实现七夕情人节3D玫瑰花效果代码
2015/08/04 Javascript
jQuery自定义动画函数实例详解(附demo源码)
2015/12/10 Javascript
jQuery的Each比JS原生for循环性能慢很多的原因
2016/07/05 Javascript
JS数组返回去重后数据的方法解析
2017/01/03 Javascript
vue下canvas裁剪图片实例讲解
2020/04/16 Javascript
JS实现数据动态渲染的竖向步骤条
2020/06/24 Javascript
vue项目接口域名动态获取操作
2020/08/13 Javascript
vue使用过滤器格式化日期
2021/01/20 Vue.js
python合并已经存在的sheet数据到新sheet的方法
2018/12/11 Python
在pytorch中为Module和Tensor指定GPU的例子
2019/08/19 Python
Python插入Elasticsearch操作方法解析
2020/01/19 Python
如何使用PyCharm将代码上传到GitHub上(图文详解)
2020/04/27 Python
基于CSS3制作立体效果导航菜单
2016/01/12 HTML / CSS
将SVG图引入到HTML页面的实现
2019/09/20 HTML / CSS
Maison Lab荷兰:名牌Outlet购物
2018/08/10 全球购物
C++:memset ,memcpy和strcpy的根本区别
2013/04/27 面试题
Prototype如何为一个Ajax添加一个参数
2015/12/06 面试题
物流专业大学生的自我鉴定
2013/11/13 职场文书
年终晚会主持词
2014/03/25 职场文书
授权委托书
2014/07/31 职场文书
学校实习推荐信
2015/03/27 职场文书
2015年安全生产管理工作总结
2015/05/25 职场文书
六一亲子活动感想
2015/08/07 职场文书
2016年优秀班主任先进事迹材料
2016/02/26 职场文书
MySQL 计算连续登录天数
2022/05/11 MySQL