python词云库wordcloud的使用方法与实例详解


Posted in Python onFebruary 17, 2020

wordcloud是优秀的词云展示第三方库

python词云库wordcloud的使用方法与实例详解

一、基本使用

import jieba
import wordcloud
txt = open("1.txt", "r", encoding='utf-8').read()

words = jieba.lcut(txt)
txt_1 = " ".join(words)
# print(txt1)
w = wordcloud.WordCloud(font_path="msyh.ttc",
      width=1000, height=700, background_color="white",
      )
w.generate(txt_1)
w.to_file("ciyun.png")

二、按图片形状生成

import jieba
from wordcloud import WordCloud, STOPWORDS, ImageColorGenerator
import numpy as np
from PIL import Image

txt = open("C:/Users/96356/Desktop/1.txt", "r", encoding='utf-8').read()

words = jieba.lcut(txt)
txt_1 = " ".join(words)
photo = np.array(Image.open('C:/Users/96356/Desktop/2.png'))
# from scipy.misc import imread
# china=imread('C:/Users/96356/Desktop/2.png') #scipy.misc方式都可以读取图片

w = WordCloud(font_path="msyh.ttc",
    mask=photo,
    background_color="white",
    )
w.generate(txt_1)
w.to_file("ciyun.png")

三、WordCloud参数详解

from wordcloud import WordCloud

参数 作用
font_path 字体路径,需要展现什么字体就把该字体路径+后缀名写上,如:font_path = ‘黑体.ttf'
width 输出的画布宽度,默认为400像素
height 输出的画布高度,默认为200像素
prefer_horizontal 词语水平方向排版出现的频率,默认 0.9 (所以词语垂直方向排版出现频率为 0.1 )
mask 如果参数为空,则使用二维遮罩绘制词云。如果 mask 非空,设置的宽高值将被忽略,遮罩形状被 mask 取代。除全白(#FFFFFF)的部分将不会绘制,其余部分会用于绘制词云。如:bg_pic = imread(‘读取一张图片.png'),背景图片的画布一定要设置为白色(#FFFFFF),然后显示的形状为不是白色的其他颜色。可以用ps工具将自己要显示的形状复制到一个纯白色的画布上再保存,就ok了。一般为mask=np.array(Image.open(‘xxx.jpg'))。其中from PIL import Image
scale 按照比例进行放大画布,如设置为1.5,则长和宽都是原来画布的1.5倍
min_font_size 显示的最小的字体大小
font_step 字体步长,如果步长大于1,会加快运算但是可能导致结果出现较大的误差
max_words 要显示的词的最大个数
stopwords 设置需要屏蔽的词,如果为空,则使用内置的STOPWORDS
background_color 背景颜色,如background_color=‘white',背景颜色为白色
max_font_size 显示的最大的字体大小
mode 当参数为“RGBA”并且background_color不为空时,背景为透明
relative_scaling 词频和字体大小的关联性
color_func 生成新颜色的函数,如果为空,则使用 self.color_func
regexp 使用正则表达式分隔输入的文本
collocations 是否包括两个词的搭配
colormap 给每个单词随机分配颜色,若指定color_func,则忽略该方法
random_state 为每个单词返回一个PIL颜色

其他部分函数

函数 作用
fit_words(frequencies) 根据词频生成词云
generate(text) 根据文本生成词云
generate_from_frequencies(frequencies[, …]) 根据词频生成词云
generate_from_text(text) 根据文本生成词云
process_text(text) 将长文本分词并去除屏蔽词(此处指英语,中文分词还是需要自己用别的库先行实现,使用上面的 fit_words(frequencies) )
recolor([random_state, color_func, colormap]) 对现有输出重新着色。重新上色会比重新生成整个词云快很多
to_array() 转化为 numpy array
to_file(filename) 输出到文件

更多关于python词云库wordcloud的使用方法请查看下面的相关文章

Python 相关文章推荐
python进阶教程之文本文件的读取和写入
Aug 29 Python
实例解析Python的Twisted框架中Deferred对象的用法
May 25 Python
Python学习之用pygal画世界地图实例
Dec 07 Python
Python模拟随机游走图形效果示例
Feb 06 Python
Python cookbook(数据结构与算法)在字典中将键映射到多个值上的方法
Feb 18 Python
Python unittest模块用法实例分析
May 25 Python
python 计算数据偏差和峰度的方法
Jun 29 Python
Django实现文件上传下载
Oct 06 Python
通过实例解析Python return运行原理
Mar 04 Python
详解python环境安装selenium和手动下载安装selenium的方法
Mar 17 Python
python删除某个目录文件夹的方法
May 26 Python
python实现MD5进行文件去重的示例代码
Jul 09 Python
tensorflow保持每次训练结果一致的简单实现
Feb 17 #Python
Python基于Socket实现简单聊天室
Feb 17 #Python
TFRecord文件查看包含的所有Features代码
Feb 17 #Python
tensorflow之tf.record实现存浮点数数组
Feb 17 #Python
Python读取表格类型文件代码实例
Feb 17 #Python
基于Python获取docx/doc文件内容代码解析
Feb 17 #Python
Python多线程获取返回值代码实例
Feb 17 #Python
You might like
php简单封装了一些常用JS操作
2007/02/25 PHP
PHP中大于2038年时间戳的问题处理方案
2015/03/03 PHP
php简单实现文件或图片强制下载的方法
2016/12/06 PHP
PHP使用栈解决约瑟夫环问题算法示例
2017/08/27 PHP
php-fpm添加service服务的例子
2018/04/27 PHP
javascript getElementsByClassName函数
2010/04/01 Javascript
JavaScript.The.Good.Parts阅读笔记(二)作用域&闭包&减缓全局空间污染
2010/11/16 Javascript
jQuery实现带延迟效果的滑动菜单代码
2015/09/02 Javascript
jQuery移动web开发中的页面初始化与加载事件
2015/12/03 Javascript
JavaScript实现打开链接页面的方式汇总
2016/06/02 Javascript
浅谈JQuery+ajax+jsonp 跨域访问
2016/06/25 Javascript
ajax请求+vue.js渲染+页面加载的示例
2018/02/11 Javascript
Vue动态获取width的方法
2018/08/22 Javascript
Vue的watch和computed方法的使用及区别介绍
2018/09/06 Javascript
基于vue+axios+lrz.js微信端图片压缩上传方法
2019/06/25 Javascript
记录微信小程序 height: calc(xx - xx);无效问题
2019/12/30 Javascript
详解基于element的区间选择组件校验(交易金额)
2021/01/07 Javascript
Python脚本文件打包成可执行文件的方法
2015/06/02 Python
基于Django URL传参 FORM表单传数据 get post的用法实例
2018/05/28 Python
python 基本数据类型占用内存空间大小的实例
2018/06/12 Python
pyQt5实时刷新界面的示例
2019/06/25 Python
对Python中画图时候的线类型详解
2019/07/07 Python
Python依赖包整体迁移方法详解
2019/08/15 Python
Python基于Socket实现简单聊天室
2020/02/17 Python
俄罗斯美容和健康网上商店:Созвездие Красоты
2019/07/23 全球购物
Edwaybuy西班牙:小米在线商店
2019/12/04 全球购物
马德里运动鞋商店:Nigra Mercato
2020/02/16 全球购物
专科生就业求职信
2014/06/22 职场文书
我的中国梦演讲稿初中篇
2014/08/19 职场文书
敬老月活动总结
2014/08/28 职场文书
大三学年自我鉴定范文(3篇)
2014/09/28 职场文书
党干部专题民主生活会对照检查材料思想汇报
2014/10/06 职场文书
离婚案件被告代理词
2015/05/23 职场文书
工作证明书
2015/06/15 职场文书
2015年重阳节主持词
2015/07/04 职场文书
学习nginx基础知识
2021/09/04 Servers