基于Python词云分析政府工作报告关键词


Posted in Python onJune 02, 2020

前言

十三届全国人大三次会议作了政府工作报告。这份政府工作报告仅有10500字左右,据悉是改革开放40年以来最短的一次。受到疫情影响,今年的两会会议适当缩短,政府工作报告也大幅压缩,体现了“实干为要”的理念。那么,这份政府工作报告突出强调了哪些关键词呢?我们其实可以基于Python技术进行词频分析和词云制作!

import matplotlib.pyplot as plt#绘图库
import jieba
from wordcloud import WordCloud

# 读入文本数据
fp = open(r'D:\爬虫下载\2020年政府工作报告.txt','r',encoding='utf-8')
content = fp.read()
# print(content)
#分词
words = jieba.lcut(content)
# 词频分析操作
data = {}
for word in words:
  if len(word)>1:
    if word in data:
      data[word]+=1
    else:
      data[word]=1
# print(data)

#排序
hist = list(data.items())#转成列表
hist.sort(key=lambda x:x[1],reverse=True)
# print(hist)

#调试输出
for i in range(20):
  # print(hist[i])
  print('{:<10}{:>5}'.format(hist[i][0],hist[i][1]))#左对齐10,右对齐5个长度

下表统计了今年的政府工作报告中出现次数最多的几个关键词。我们可以看到,今年的政府工作报告中提到“发展”的次数最多,一共出现了69次,“发展”一直都是政府工作报告中的重要关键词;其次是“就业”,出现了39次,足以显示新冠疫情之下就业问题的严峻性,以及党中央、国务院对就业问题的高度重视,政府工作报告中没有提出全年经济增速的具体目标,但仍然提出了就业目标——城镇新增就业900万人以上、城镇调查失业率6%左右、城镇登记失业率5.5%左右;第三多的就是“疫情”,报告中多次提到疫情防控工作,并指出这次新冠肺炎疫情,是新中国成立以来我国遭遇的传播速度最快、感染范围最广、防控难度最大的公共卫生事件。

基于Python词云分析政府工作报告关键词

“企业”作为市场经济的主体,出现的次数达到了30次,要想保障就业和民生,必须稳住上亿市场主体,尽力帮助企业特别是中小微企业、个体工商户渡过难关,报告提出要加大宏观政策实施力度,着力稳企业保就业。还有“支持”、“保障”、“加强”、“推进”等鼓舞人心的关键词出现次数也很多,相信大家看到政府工作报告中满满的政策“干货”,信心和底气也会更足了。

根据关键词的出现次数,我们可以使用Python绘制出政府工作报告词云图。Python的词云功能相当强大,你可以自己设定形状、字体、大小!

result = ' '.join(words)
# print(result)
#生成词云
wc = WordCloud(
  font_path=r'D:\PPT\ppt字体\思源宋体SC-Regular.otf',
  background_color = 'white',#背景颜色
  width=500,#图片的宽
  height=300,
  max_font_size=50,
  min_font_size=12
)
wc.generate(result)
wc.to_file(r'.\wordcloud.png')#保存图片
#显示图片
plt.figure('政府工作报告')
plt.imshow(wc)
plt.axis('off')#关闭坐标轴
plt.show()

基于Python词云分析政府工作报告关键词

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
使用Python脚本将文字转换为图片的实例分享
Aug 29 Python
基于Python的文件类型和字符串详解
Dec 21 Python
TensorFlow高效读取数据的方法示例
Feb 06 Python
详解Django之auth模块(用户认证)
Apr 17 Python
解决PyCharm控制台输出乱码的问题
Jan 16 Python
Python数据处理篇之Sympy系列(五)---解方程
Oct 12 Python
Python3 mmap内存映射文件示例解析
Mar 23 Python
django模型类中,null=True,blank=True用法说明
Jul 09 Python
4款Python 类型检查工具,你选择哪个呢?
Oct 30 Python
python中@property的作用和getter setter的解释
Dec 22 Python
解决pytorch 模型复制的一些问题
Mar 03 Python
python数字图像处理:图像的绘制
Jun 28 Python
使用OpenCV获取图像某点的颜色值,并设置某点的颜色
Jun 02 #Python
如何利用python web框架做文件流下载的实现示例
Jun 02 #Python
python3+opencv 使用灰度直方图来判断图片的亮暗操作
Jun 02 #Python
Java多线程实现四种方式原理详解
Jun 02 #Python
Python+Kepler.gl轻松制作酷炫路径动画的实现示例
Jun 02 #Python
opencv+python实现鼠标点击图像,输出该点的RGB和HSV值
Jun 02 #Python
简单介绍一下pyinstaller打包以及安全性的实现
Jun 02 #Python
You might like
php生成缩略图的类代码
2008/10/02 PHP
PHP 多进程 解决难题
2009/06/22 PHP
php获取文件名后缀常用方法小结
2015/02/24 PHP
WordPress自定义时间显示格式
2015/03/27 PHP
最新版本PHP 7 vs HHVM 多角度比较
2016/02/14 PHP
thinkphp3.2.3版本的数据库增删改查实现代码
2016/09/22 PHP
摘自百度的图片轮换效果代码
2007/11/19 Javascript
img的onload的另类用法
2008/01/10 Javascript
Mootools 1.2教程 Tooltips
2009/09/15 Javascript
用jquery存取照片的具体实现方法
2013/06/30 Javascript
jQuery 绑定事件到动态创建的元素上的方法实例
2013/08/18 Javascript
教你JS中的运算符乘方、开方及变量格式转换
2016/08/09 Javascript
javascript 定时器工作原理分析
2016/12/03 Javascript
详解angularjs结合pagination插件实现分页功能
2017/02/10 Javascript
jQuery实现锚点向下平滑滚动特效示例
2017/08/29 jQuery
js 取消页面可以选中文字的功能方法
2018/01/02 Javascript
解决vue+webpack打包路径的问题
2018/03/06 Javascript
jQuery实现的五星点评功能【案例】
2019/02/18 jQuery
基于Element的组件改造的树形选择器(树形下拉框)
2020/02/27 Javascript
详解vue中v-on事件监听指令的基本用法
2020/07/22 Javascript
Python中如何优雅的合并两个字典(dict)方法示例
2017/08/09 Python
Python实现螺旋矩阵的填充算法示例
2017/12/28 Python
Python + selenium + requests实现12306全自动抢票及验证码破解加自动点击功能
2018/11/23 Python
简单了解python 生成器 列表推导式 生成器表达式
2019/08/22 Python
Python 批量刷博客园访问量脚本过程解析
2019/08/30 Python
Ancheer官方户外和运动商店:销售电动自行车
2019/08/07 全球购物
怎样客观的做好自我评价
2013/12/28 职场文书
大课间活动制度
2014/01/18 职场文书
教师师德演讲稿
2014/05/06 职场文书
学校宣传标语
2014/06/18 职场文书
运动会观后感
2015/06/09 职场文书
2016年学校“6﹒26国际禁毒日”宣传活动总结
2016/04/05 职场文书
Nginx的反向代理实例详解
2021/03/31 Servers
tensorboard 可视化之localhost:6006不显示的解决方案
2021/05/22 Python
解决mysql:ERROR 1045 (28000): Access denied for user 'root'@'localhost' (using password: NO/YES)
2021/06/26 MySQL
Vue操作Storage本地化存储
2022/04/29 Vue.js