基于Python词云分析政府工作报告关键词


Posted in Python onJune 02, 2020

前言

十三届全国人大三次会议作了政府工作报告。这份政府工作报告仅有10500字左右,据悉是改革开放40年以来最短的一次。受到疫情影响,今年的两会会议适当缩短,政府工作报告也大幅压缩,体现了“实干为要”的理念。那么,这份政府工作报告突出强调了哪些关键词呢?我们其实可以基于Python技术进行词频分析和词云制作!

import matplotlib.pyplot as plt#绘图库
import jieba
from wordcloud import WordCloud

# 读入文本数据
fp = open(r'D:\爬虫下载\2020年政府工作报告.txt','r',encoding='utf-8')
content = fp.read()
# print(content)
#分词
words = jieba.lcut(content)
# 词频分析操作
data = {}
for word in words:
  if len(word)>1:
    if word in data:
      data[word]+=1
    else:
      data[word]=1
# print(data)

#排序
hist = list(data.items())#转成列表
hist.sort(key=lambda x:x[1],reverse=True)
# print(hist)

#调试输出
for i in range(20):
  # print(hist[i])
  print('{:<10}{:>5}'.format(hist[i][0],hist[i][1]))#左对齐10,右对齐5个长度

下表统计了今年的政府工作报告中出现次数最多的几个关键词。我们可以看到,今年的政府工作报告中提到“发展”的次数最多,一共出现了69次,“发展”一直都是政府工作报告中的重要关键词;其次是“就业”,出现了39次,足以显示新冠疫情之下就业问题的严峻性,以及党中央、国务院对就业问题的高度重视,政府工作报告中没有提出全年经济增速的具体目标,但仍然提出了就业目标——城镇新增就业900万人以上、城镇调查失业率6%左右、城镇登记失业率5.5%左右;第三多的就是“疫情”,报告中多次提到疫情防控工作,并指出这次新冠肺炎疫情,是新中国成立以来我国遭遇的传播速度最快、感染范围最广、防控难度最大的公共卫生事件。

基于Python词云分析政府工作报告关键词

“企业”作为市场经济的主体,出现的次数达到了30次,要想保障就业和民生,必须稳住上亿市场主体,尽力帮助企业特别是中小微企业、个体工商户渡过难关,报告提出要加大宏观政策实施力度,着力稳企业保就业。还有“支持”、“保障”、“加强”、“推进”等鼓舞人心的关键词出现次数也很多,相信大家看到政府工作报告中满满的政策“干货”,信心和底气也会更足了。

根据关键词的出现次数,我们可以使用Python绘制出政府工作报告词云图。Python的词云功能相当强大,你可以自己设定形状、字体、大小!

result = ' '.join(words)
# print(result)
#生成词云
wc = WordCloud(
  font_path=r'D:\PPT\ppt字体\思源宋体SC-Regular.otf',
  background_color = 'white',#背景颜色
  width=500,#图片的宽
  height=300,
  max_font_size=50,
  min_font_size=12
)
wc.generate(result)
wc.to_file(r'.\wordcloud.png')#保存图片
#显示图片
plt.figure('政府工作报告')
plt.imshow(wc)
plt.axis('off')#关闭坐标轴
plt.show()

基于Python词云分析政府工作报告关键词

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python操作sqlite3快速、安全插入数据(防注入)的实例
Apr 26 Python
简单的Python抓taobao图片爬虫
Oct 26 Python
Python中给List添加元素的4种方法分享
Nov 28 Python
以windows service方式运行Python程序的方法
Jun 03 Python
pytorch使用Variable实现线性回归
May 21 Python
Python 串口读写的实现方法
Jun 12 Python
对python 树状嵌套结构的实现思路详解
Aug 09 Python
Python中turtle库的使用实例
Sep 09 Python
python调用接口的4种方式代码实例
Nov 19 Python
python cv2在验证码识别中应用实例解析
Dec 25 Python
Python使用qrcode二维码库生成二维码方法详解
Feb 17 Python
使用Nibabel库对nii格式图像的读写操作
Jul 01 Python
使用OpenCV获取图像某点的颜色值,并设置某点的颜色
Jun 02 #Python
如何利用python web框架做文件流下载的实现示例
Jun 02 #Python
python3+opencv 使用灰度直方图来判断图片的亮暗操作
Jun 02 #Python
Java多线程实现四种方式原理详解
Jun 02 #Python
Python+Kepler.gl轻松制作酷炫路径动画的实现示例
Jun 02 #Python
opencv+python实现鼠标点击图像,输出该点的RGB和HSV值
Jun 02 #Python
简单介绍一下pyinstaller打包以及安全性的实现
Jun 02 #Python
You might like
PHP4 与 MySQL 数据库操作函数详解
2006/10/09 PHP
PHP计划任务之关闭浏览器后仍然继续执行的函数
2010/07/22 PHP
解析如何用php screw加密php源代码
2013/06/20 PHP
新手菜鸟必读:session与cookie的区别
2013/08/22 PHP
php判断电脑访问、手机访问的例子
2014/05/10 PHP
PHP云打印类完整示例
2016/10/15 PHP
laravel框架select2多选插件初始化默认选中项操作示例
2020/02/18 PHP
Eclipse去除js(JavaScript)验证错误
2014/02/11 Javascript
Express实现前端后端通信上传图片之存储数据库(mysql)傻瓜式教程(二)
2015/12/10 Javascript
js倒计时简单实现方法
2015/12/17 Javascript
JavaScript的字符串方法汇总
2016/07/31 Javascript
Jquery调用iframe父页面中的元素及方法
2016/08/23 Javascript
JavaScript生成验证码并实现验证功能
2016/09/24 Javascript
JS调用打印机功能简单示例
2016/11/28 Javascript
Vue.js中轻松解决v-for执行出错的三个方案
2017/06/09 Javascript
解决bootstrap下拉菜单点击立即隐藏bug的方法
2017/06/13 Javascript
基于 Immutable.js 实现撤销重做功能的实例代码
2018/03/01 Javascript
jQuery实现简单复制json对象和json对象集合操作示例
2018/07/09 jQuery
开发一个Parcel-vue脚手架工具(详细步骤)
2018/09/22 Javascript
利用jqgrid实现上移下移单元格功能
2018/11/07 Javascript
jQuery子选择器与可见性选择器实例分析
2019/06/28 jQuery
node爬取新型冠状病毒的疫情实时动态
2020/02/06 Javascript
iview实现动态表单和自定义验证时间段重叠
2021/01/10 Javascript
vue 页面跳转的实现方式
2021/01/12 Vue.js
Python ZipFile模块详解
2013/11/01 Python
python爬虫_自动获取seebug的poc实例
2017/08/05 Python
Python中字符串String的基本内置函数与过滤字符模块函数的基本用法
2019/05/27 Python
python分数表示方式和写法
2019/06/26 Python
Python Pandas数据分析工具用法实例
2020/11/05 Python
Web页面中八种创建多列等高(等高列布局)的实现技术
2012/12/24 HTML / CSS
洲际酒店集团大中华区:IHG中国
2016/08/17 全球购物
巴西手表购物网站:eclock
2019/03/19 全球购物
毕业设计计划书
2014/01/09 职场文书
干部四风问题整改措施思想汇报
2014/10/13 职场文书
工人先锋号申报材料
2014/12/29 职场文书
保送生自荐信
2015/03/06 职场文书