基于Python词云分析政府工作报告关键词


Posted in Python onJune 02, 2020

前言

十三届全国人大三次会议作了政府工作报告。这份政府工作报告仅有10500字左右,据悉是改革开放40年以来最短的一次。受到疫情影响,今年的两会会议适当缩短,政府工作报告也大幅压缩,体现了“实干为要”的理念。那么,这份政府工作报告突出强调了哪些关键词呢?我们其实可以基于Python技术进行词频分析和词云制作!

import matplotlib.pyplot as plt#绘图库
import jieba
from wordcloud import WordCloud

# 读入文本数据
fp = open(r'D:\爬虫下载\2020年政府工作报告.txt','r',encoding='utf-8')
content = fp.read()
# print(content)
#分词
words = jieba.lcut(content)
# 词频分析操作
data = {}
for word in words:
  if len(word)>1:
    if word in data:
      data[word]+=1
    else:
      data[word]=1
# print(data)

#排序
hist = list(data.items())#转成列表
hist.sort(key=lambda x:x[1],reverse=True)
# print(hist)

#调试输出
for i in range(20):
  # print(hist[i])
  print('{:<10}{:>5}'.format(hist[i][0],hist[i][1]))#左对齐10,右对齐5个长度

下表统计了今年的政府工作报告中出现次数最多的几个关键词。我们可以看到,今年的政府工作报告中提到“发展”的次数最多,一共出现了69次,“发展”一直都是政府工作报告中的重要关键词;其次是“就业”,出现了39次,足以显示新冠疫情之下就业问题的严峻性,以及党中央、国务院对就业问题的高度重视,政府工作报告中没有提出全年经济增速的具体目标,但仍然提出了就业目标——城镇新增就业900万人以上、城镇调查失业率6%左右、城镇登记失业率5.5%左右;第三多的就是“疫情”,报告中多次提到疫情防控工作,并指出这次新冠肺炎疫情,是新中国成立以来我国遭遇的传播速度最快、感染范围最广、防控难度最大的公共卫生事件。

基于Python词云分析政府工作报告关键词

“企业”作为市场经济的主体,出现的次数达到了30次,要想保障就业和民生,必须稳住上亿市场主体,尽力帮助企业特别是中小微企业、个体工商户渡过难关,报告提出要加大宏观政策实施力度,着力稳企业保就业。还有“支持”、“保障”、“加强”、“推进”等鼓舞人心的关键词出现次数也很多,相信大家看到政府工作报告中满满的政策“干货”,信心和底气也会更足了。

根据关键词的出现次数,我们可以使用Python绘制出政府工作报告词云图。Python的词云功能相当强大,你可以自己设定形状、字体、大小!

result = ' '.join(words)
# print(result)
#生成词云
wc = WordCloud(
  font_path=r'D:\PPT\ppt字体\思源宋体SC-Regular.otf',
  background_color = 'white',#背景颜色
  width=500,#图片的宽
  height=300,
  max_font_size=50,
  min_font_size=12
)
wc.generate(result)
wc.to_file(r'.\wordcloud.png')#保存图片
#显示图片
plt.figure('政府工作报告')
plt.imshow(wc)
plt.axis('off')#关闭坐标轴
plt.show()

基于Python词云分析政府工作报告关键词

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
pycharm 使用心得(六)进行简单的数据库管理
Jun 06 Python
Python实现线程池代码分享
Jun 21 Python
浅谈Python使用Bottle来提供一个简单的web服务
Dec 27 Python
Python实现基于C/S架构的聊天室功能详解
Jul 07 Python
Python-while 计算100以内奇数和的方法
Jun 11 Python
Python列表对象实现原理详解
Jul 01 Python
Pytorch 抽取vgg各层并进行定制化处理的方法
Aug 20 Python
python多进程下的生产者和消费者模型
May 07 Python
Python如何转换字符串大小写
Jun 04 Python
python能做哪方面的工作
Jun 15 Python
详解Python openpyxl库的基本应用
Feb 26 Python
python实现股票历史数据可视化分析案例
Jun 10 Python
使用OpenCV获取图像某点的颜色值,并设置某点的颜色
Jun 02 #Python
如何利用python web框架做文件流下载的实现示例
Jun 02 #Python
python3+opencv 使用灰度直方图来判断图片的亮暗操作
Jun 02 #Python
Java多线程实现四种方式原理详解
Jun 02 #Python
Python+Kepler.gl轻松制作酷炫路径动画的实现示例
Jun 02 #Python
opencv+python实现鼠标点击图像,输出该点的RGB和HSV值
Jun 02 #Python
简单介绍一下pyinstaller打包以及安全性的实现
Jun 02 #Python
You might like
PHP 引用是个坏习惯
2010/03/12 PHP
php 随机记录mysql rand()造成CPU 100%的解决办法
2010/05/18 PHP
一个比较不错的PHP日历类分享
2014/11/18 PHP
php批量删除cookie的简单实现方法
2015/01/26 PHP
php 伪造HTTP_REFERER页面URL来源的三种方法
2016/09/22 PHP
php结合ajax实现手机发红包的案例
2016/10/13 PHP
YII框架批量插入数据的方法
2017/03/18 PHP
php中时间函数date及常用的时间计算
2017/05/12 PHP
在IE模态窗口中自由查看HTML源码的方法
2007/03/08 Javascript
再谈IE中Flash控件的自动激活 ObjectWrap
2007/03/09 Javascript
一步一步制作jquery插件Tabs实现过程
2010/07/06 Javascript
Jquery submit()无法提交问题
2013/04/21 Javascript
javascript中Math.random()使用详解
2015/04/15 Javascript
介绍JavaScript中Math.abs()方法的使用
2015/06/14 Javascript
微信小程序滚动Tab实现左右可滑动切换
2017/08/17 Javascript
jquery实现用户登陆界面(示例讲解)
2017/09/06 jQuery
JavaScript+CSS相册特效实例代码
2017/09/07 Javascript
node.js之基础加密算法模块crypto详解
2018/09/11 Javascript
Vue.extend实现挂载到实例上的方法
2019/05/01 Javascript
微信小程序学习总结(一)项目创建与目录结构分析
2020/06/04 Javascript
[42:36]DOTA2上海特级锦标赛B组败者赛 VG VS Spirit第二局
2016/02/26 DOTA
使用Python获取Linux系统的各种信息
2014/07/10 Python
Python中使用PDB库调试程序
2015/04/05 Python
python计算一个序列的平均值的方法
2015/07/11 Python
多版本Python共存的配置方法
2017/05/22 Python
python实现员工管理系统
2018/01/11 Python
Django渲染Markdown文章目录的方法示例
2019/01/02 Python
pytorch .detach() .detach_() 和 .data用于切断反向传播的实现
2019/12/27 Python
Python下利用BeautifulSoup解析HTML的实现
2020/01/17 Python
ajax是什么及其工作原理
2012/02/08 面试题
介绍一下Java中标识符的命名规则
2014/02/03 面试题
高二学年自我鉴定范文(2篇)
2014/09/26 职场文书
2014年新农村建设工作总结
2014/12/01 职场文书
提档介绍信范文
2015/10/22 职场文书
2019暑假学生安全口号
2019/06/27 职场文书
使用react+redux实现计数器功能及遇到问题
2021/06/02 Javascript