Python制作词云图代码实例


Posted in Python onSeptember 09, 2019

词云图是将词汇按照频率的高低显示不同大小而形成的图,可以一目了然地看出关键词。下面是词云图的python代码~

#导入需要模块
import jieba
import numpy as np 
import matplotlib.pyplot as plt 
from PIL import Image 
from wordcloud import WordCloud, STOPWORDS, ImageColorGenerator

text_road=str(input('请输入文章的路径:'))
picture_road=str(input('请输入图片的路径:'))

#加载需要分析的文章
text = open(text_road,'r',encoding='utf-8').read()

#对文章进行分词
wordlist_after_jieba = jieba.cut(text, cut_all=False)
wl_space_split = " ".join(wordlist_after_jieba)

#读取照片通过numpy.array函数将照片等结构数据转化为np-array
mask=np.array(Image.open(picture_road))

#选择屏蔽词,不显示在词云里面
stopwords = set(STOPWORDS)
#可以加多个屏蔽词
stopwords.add("<br/>")

#创建词云对象
wc = WordCloud(
    background_color="white",
    font_path='/Library/Fonts/Arial Unicode.ttf',
    max_words=1000, # 最多显示词数
    mask=mask, 
    stopwords=stopwords,
    max_font_size=100 # 字体最大值
    )

#生成词云
wc.generate(text)

#从背景图建立颜色方案
image_colors =ImageColorGenerator(mask) 

#将词云颜色设置为背景图方案
wc.recolor(color_func=image_colors) 

#显示词云
plt.imshow(wc,interpolation='bilinear')

#关闭坐标轴
plt.axis("off")

#显示图像
plt.show()

#保存词云
wc.to_file('词云图.png')

下面这张图是我爬了阿里巴巴招聘网站上所有数据分析职位需求,生成的词云图,大家可以看看阿里对数据分析师的要求~

Python制作词云图代码实例

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
tornado框架blog模块分析与使用
Nov 21 Python
python中元类用法实例
Oct 10 Python
Python中isnumeric()方法的使用简介
May 19 Python
Python3如何解决字符编码问题详解
Apr 23 Python
Python Xml文件添加字节属性的方法
Mar 31 Python
python读取excel指定列数据并写入到新的excel方法
Jul 10 Python
Python中单线程、多线程和多进程的效率对比实验实例
May 14 Python
使用Python的Turtle库绘制森林的实例
Dec 18 Python
Python tornado上传文件的功能
Mar 26 Python
Django ORM filter() 的运用详解
May 14 Python
python自动化发送邮件实例讲解
Jan 04 Python
Python基础之变量的相关知识总结
Jun 23 Python
PyCharm2018 安装及破解方法实现步骤
Sep 09 #Python
浅谈pycharm使用及设置方法
Sep 09 #Python
在pycharm中配置Anaconda以及pip源配置详解
Sep 09 #Python
django 多对多表的创建和插入代码实现
Sep 09 #Python
Python中的单下划线和双下划线使用场景详解
Sep 09 #Python
python 批量修改 labelImg 生成的xml文件的方法
Sep 09 #Python
Python定时发送天气预报邮件代码实例
Sep 09 #Python
You might like
PHP无限分类(树形类)的深入分析
2013/06/02 PHP
PHP命名空间(namespace)的动态访问及使用技巧
2014/08/18 PHP
PHP中exec与system用法区别分析
2014/09/22 PHP
php+ajax 实现输入读取数据库显示匹配信息
2015/10/08 PHP
CI框架整合widget(页面格局)的方法
2016/05/17 PHP
php+lottery.js实现九宫格抽奖功能
2019/07/21 PHP
Laravel find in set排序实例
2019/10/09 PHP
javascript Array.remove() 数组删除
2009/08/06 Javascript
js字符串转换成xml对象并使用技巧解读
2013/04/18 Javascript
轻松创建nodejs服务器(2):nodejs服务器的构成分析
2014/12/18 NodeJs
javascript实现的猜数小游戏完整实例代码
2016/05/10 Javascript
AngularJS表单详解及示例代码
2016/08/17 Javascript
浅谈jquery中next与siblings的区别
2016/10/27 Javascript
js+html5实现半透明遮罩层弹框效果
2020/08/24 Javascript
koa2的中间件功能及应用示例
2020/03/05 Javascript
[33:23]VG vs Pain 2018国际邀请赛小组赛BO2 第二场 8.18
2018/08/19 DOTA
python回溯法实现数组全排列输出实例分析
2015/03/17 Python
TensorFlow Session会话控制&amp;Variable变量详解
2018/07/30 Python
Empty test suite.(PyCharm程序运行错误的解决方法)
2018/11/30 Python
pytorch实现onehot编码转为普通label标签
2020/01/02 Python
Windows上安装tensorflow  详细教程(图文详解)
2020/02/04 Python
python 使用while循环输出*组成的菱形实例
2020/04/12 Python
一款纯css3实现的漂亮的404页面的实例教程
2014/11/27 HTML / CSS
详解CSS3中强大的filter(滤镜)属性
2017/06/29 HTML / CSS
阿迪达斯荷兰官方网站:adidas荷兰
2018/03/16 全球购物
英国Office鞋店德国网站:在线购买鞋子、靴子和运动鞋
2018/12/19 全球购物
Helly Hansen工作服美国官方网上商店:为最恶劣的环境
2019/09/04 全球购物
数字漫画:comiXology
2020/06/13 全球购物
什么是测试驱动开发(TDD)
2012/02/15 面试题
食品安全处置方案
2014/06/14 职场文书
森林防火标语
2014/06/23 职场文书
2015年上半年信访工作总结
2015/03/30 职场文书
升学宴学生致辞
2015/09/29 职场文书
导游词之广州陈家祠
2019/10/21 职场文书
Nginx stream 配置代理(Nginx TCP/UDP 负载均衡)
2021/11/17 Servers
vue组件vue-esign实现电子签名
2022/04/21 Vue.js