python词云库wordcloud的使用方法与实例详解


Posted in Python onFebruary 17, 2020

wordcloud是优秀的词云展示第三方库

python词云库wordcloud的使用方法与实例详解

一、基本使用

import jieba
import wordcloud
txt = open("1.txt", "r", encoding='utf-8').read()

words = jieba.lcut(txt)
txt_1 = " ".join(words)
# print(txt1)
w = wordcloud.WordCloud(font_path="msyh.ttc",
      width=1000, height=700, background_color="white",
      )
w.generate(txt_1)
w.to_file("ciyun.png")

二、按图片形状生成

import jieba
from wordcloud import WordCloud, STOPWORDS, ImageColorGenerator
import numpy as np
from PIL import Image

txt = open("C:/Users/96356/Desktop/1.txt", "r", encoding='utf-8').read()

words = jieba.lcut(txt)
txt_1 = " ".join(words)
photo = np.array(Image.open('C:/Users/96356/Desktop/2.png'))
# from scipy.misc import imread
# china=imread('C:/Users/96356/Desktop/2.png') #scipy.misc方式都可以读取图片

w = WordCloud(font_path="msyh.ttc",
    mask=photo,
    background_color="white",
    )
w.generate(txt_1)
w.to_file("ciyun.png")

三、WordCloud参数详解

from wordcloud import WordCloud

参数 作用
font_path 字体路径,需要展现什么字体就把该字体路径+后缀名写上,如:font_path = ‘黑体.ttf'
width 输出的画布宽度,默认为400像素
height 输出的画布高度,默认为200像素
prefer_horizontal 词语水平方向排版出现的频率,默认 0.9 (所以词语垂直方向排版出现频率为 0.1 )
mask 如果参数为空,则使用二维遮罩绘制词云。如果 mask 非空,设置的宽高值将被忽略,遮罩形状被 mask 取代。除全白(#FFFFFF)的部分将不会绘制,其余部分会用于绘制词云。如:bg_pic = imread(‘读取一张图片.png'),背景图片的画布一定要设置为白色(#FFFFFF),然后显示的形状为不是白色的其他颜色。可以用ps工具将自己要显示的形状复制到一个纯白色的画布上再保存,就ok了。一般为mask=np.array(Image.open(‘xxx.jpg'))。其中from PIL import Image
scale 按照比例进行放大画布,如设置为1.5,则长和宽都是原来画布的1.5倍
min_font_size 显示的最小的字体大小
font_step 字体步长,如果步长大于1,会加快运算但是可能导致结果出现较大的误差
max_words 要显示的词的最大个数
stopwords 设置需要屏蔽的词,如果为空,则使用内置的STOPWORDS
background_color 背景颜色,如background_color=‘white',背景颜色为白色
max_font_size 显示的最大的字体大小
mode 当参数为“RGBA”并且background_color不为空时,背景为透明
relative_scaling 词频和字体大小的关联性
color_func 生成新颜色的函数,如果为空,则使用 self.color_func
regexp 使用正则表达式分隔输入的文本
collocations 是否包括两个词的搭配
colormap 给每个单词随机分配颜色,若指定color_func,则忽略该方法
random_state 为每个单词返回一个PIL颜色

其他部分函数

函数 作用
fit_words(frequencies) 根据词频生成词云
generate(text) 根据文本生成词云
generate_from_frequencies(frequencies[, …]) 根据词频生成词云
generate_from_text(text) 根据文本生成词云
process_text(text) 将长文本分词并去除屏蔽词(此处指英语,中文分词还是需要自己用别的库先行实现,使用上面的 fit_words(frequencies) )
recolor([random_state, color_func, colormap]) 对现有输出重新着色。重新上色会比重新生成整个词云快很多
to_array() 转化为 numpy array
to_file(filename) 输出到文件

更多关于python词云库wordcloud的使用方法请查看下面的相关文章

Python 相关文章推荐
pycharm 使用心得(二)设置字体大小
Jun 05 Python
详解python如何调用C/C++底层库与互相传值
Aug 10 Python
详解Python里使用正则表达式的ASCII模式
Nov 02 Python
一份python入门应该看的学习资料
Apr 11 Python
浅谈Python在pycharm中的调试(debug)
Nov 29 Python
python3爬虫获取html内容及各属性值的方法
Dec 17 Python
python 实现一次性在文件中写入多行的方法
Jan 28 Python
Python aiohttp百万并发极限测试实例分析
Oct 26 Python
Python基础之高级变量类型实例详解
Jan 03 Python
Python退出时强制运行一段代码的实现方法
Apr 29 Python
python实现简单遗传算法
Sep 18 Python
详解Python中*args和**kwargs的使用
Apr 07 Python
tensorflow保持每次训练结果一致的简单实现
Feb 17 #Python
Python基于Socket实现简单聊天室
Feb 17 #Python
TFRecord文件查看包含的所有Features代码
Feb 17 #Python
tensorflow之tf.record实现存浮点数数组
Feb 17 #Python
Python读取表格类型文件代码实例
Feb 17 #Python
基于Python获取docx/doc文件内容代码解析
Feb 17 #Python
Python多线程获取返回值代码实例
Feb 17 #Python
You might like
10个可以简化php开发过程的MySQL工具
2010/04/11 PHP
PHP随机字符串生成代码(包括大小写字母)
2013/06/24 PHP
PHP实现支持GET,POST,Multipart/form-data的HTTP请求类
2014/09/24 PHP
php编程每天必学之验证码
2016/03/03 PHP
javascript常用方法、属性集合及NodeList 和 HTMLCollection 的浏览器差异
2010/12/25 Javascript
Jquery Uploadify上传带进度条的简单实例
2014/02/12 Javascript
jQuery实现仿美橙互联两级导航菜单的方法
2015/03/09 Javascript
简介JavaScript中的getSeconds()方法的使用
2015/06/10 Javascript
浅析jQuery移动开发中内联按钮和分组按钮的编写
2015/12/04 Javascript
Javascript removeChild()删除节点及删除子节点的方法
2015/12/27 Javascript
如何实现json数据可视化详解
2016/11/24 Javascript
详解JS-- 浮点数运算处理
2016/11/28 Javascript
setTimeout学习小结
2017/02/08 Javascript
jQuery上传多张图片带进度条样式(DEMO)
2017/03/02 Javascript
解决AjaxFileupload 上传时会出现连接重置的问题
2017/07/07 Javascript
jQuery实现table表格checkbox全选的方法分析
2018/07/04 jQuery
Vue 使用Props属性实现父子组件的动态传值详解
2019/11/13 Javascript
JSON获取属性值方法代码实例
2020/06/30 Javascript
vuejs element table 表格添加行,修改,单独删除行,批量删除行操作
2020/07/18 Javascript
Vue+axios封装请求实现前后端分离
2020/10/23 Javascript
javascript实现多边形碰撞检测
2020/10/24 Javascript
jQuery是用来干什么的 jquery其实就是一个js框架
2021/02/04 jQuery
Python实现多线程下载文件的代码实例
2014/06/01 Python
Python3处理文件中每个词的方法
2015/05/22 Python
python SMTP实现发送带附件电子邮件
2018/05/22 Python
Python 判断文件或目录是否存在的实例代码
2018/07/19 Python
美国在线和移动免费会员制批发零售商:Boxed(移动端的Costco)
2020/01/02 全球购物
资产评估专业大学生求职信
2013/09/29 职场文书
自荐信格式范文
2013/10/07 职场文书
艺术系应届生的自我评价
2013/10/19 职场文书
企业为何需要商业计划书
2013/12/26 职场文书
高一新生军训方案
2014/05/12 职场文书
上海世博会口号
2014/06/19 职场文书
报考公务员诚信承诺书
2014/08/29 职场文书
2014大学校园光棍节活动策划书
2014/09/29 职场文书
合同权益转让协议书模板
2014/11/18 职场文书