python词云库wordcloud的使用方法与实例详解


Posted in Python onFebruary 17, 2020

wordcloud是优秀的词云展示第三方库

python词云库wordcloud的使用方法与实例详解

一、基本使用

import jieba
import wordcloud
txt = open("1.txt", "r", encoding='utf-8').read()

words = jieba.lcut(txt)
txt_1 = " ".join(words)
# print(txt1)
w = wordcloud.WordCloud(font_path="msyh.ttc",
      width=1000, height=700, background_color="white",
      )
w.generate(txt_1)
w.to_file("ciyun.png")

二、按图片形状生成

import jieba
from wordcloud import WordCloud, STOPWORDS, ImageColorGenerator
import numpy as np
from PIL import Image

txt = open("C:/Users/96356/Desktop/1.txt", "r", encoding='utf-8').read()

words = jieba.lcut(txt)
txt_1 = " ".join(words)
photo = np.array(Image.open('C:/Users/96356/Desktop/2.png'))
# from scipy.misc import imread
# china=imread('C:/Users/96356/Desktop/2.png') #scipy.misc方式都可以读取图片

w = WordCloud(font_path="msyh.ttc",
    mask=photo,
    background_color="white",
    )
w.generate(txt_1)
w.to_file("ciyun.png")

三、WordCloud参数详解

from wordcloud import WordCloud

参数 作用
font_path 字体路径,需要展现什么字体就把该字体路径+后缀名写上,如:font_path = ‘黑体.ttf'
width 输出的画布宽度,默认为400像素
height 输出的画布高度,默认为200像素
prefer_horizontal 词语水平方向排版出现的频率,默认 0.9 (所以词语垂直方向排版出现频率为 0.1 )
mask 如果参数为空,则使用二维遮罩绘制词云。如果 mask 非空,设置的宽高值将被忽略,遮罩形状被 mask 取代。除全白(#FFFFFF)的部分将不会绘制,其余部分会用于绘制词云。如:bg_pic = imread(‘读取一张图片.png'),背景图片的画布一定要设置为白色(#FFFFFF),然后显示的形状为不是白色的其他颜色。可以用ps工具将自己要显示的形状复制到一个纯白色的画布上再保存,就ok了。一般为mask=np.array(Image.open(‘xxx.jpg'))。其中from PIL import Image
scale 按照比例进行放大画布,如设置为1.5,则长和宽都是原来画布的1.5倍
min_font_size 显示的最小的字体大小
font_step 字体步长,如果步长大于1,会加快运算但是可能导致结果出现较大的误差
max_words 要显示的词的最大个数
stopwords 设置需要屏蔽的词,如果为空,则使用内置的STOPWORDS
background_color 背景颜色,如background_color=‘white',背景颜色为白色
max_font_size 显示的最大的字体大小
mode 当参数为“RGBA”并且background_color不为空时,背景为透明
relative_scaling 词频和字体大小的关联性
color_func 生成新颜色的函数,如果为空,则使用 self.color_func
regexp 使用正则表达式分隔输入的文本
collocations 是否包括两个词的搭配
colormap 给每个单词随机分配颜色,若指定color_func,则忽略该方法
random_state 为每个单词返回一个PIL颜色

其他部分函数

函数 作用
fit_words(frequencies) 根据词频生成词云
generate(text) 根据文本生成词云
generate_from_frequencies(frequencies[, …]) 根据词频生成词云
generate_from_text(text) 根据文本生成词云
process_text(text) 将长文本分词并去除屏蔽词(此处指英语,中文分词还是需要自己用别的库先行实现,使用上面的 fit_words(frequencies) )
recolor([random_state, color_func, colormap]) 对现有输出重新着色。重新上色会比重新生成整个词云快很多
to_array() 转化为 numpy array
to_file(filename) 输出到文件

更多关于python词云库wordcloud的使用方法请查看下面的相关文章

Python 相关文章推荐
python中合并两个文本文件并按照姓名首字母排序的例子
Apr 25 Python
python中urllib模块用法实例详解
Nov 19 Python
Python中统计函数运行耗时的方法
May 05 Python
Python中使用不同编码读写txt文件详解
May 28 Python
Python 模拟购物车的实例讲解
Sep 11 Python
Numpy掩码式数组详解
Apr 17 Python
Python中的上下文管理器和with语句的使用
Apr 17 Python
Python第三方Window模块文件的几种安装方法
Nov 22 Python
PyQT5 QTableView显示绑定数据的实例详解
Jun 25 Python
关于python中密码加盐的学习体会小结
Jul 15 Python
基于python全局设置id 自动化测试元素定位过程解析
Sep 04 Python
Python3如何实现Win10桌面自动切换
Aug 11 Python
tensorflow保持每次训练结果一致的简单实现
Feb 17 #Python
Python基于Socket实现简单聊天室
Feb 17 #Python
TFRecord文件查看包含的所有Features代码
Feb 17 #Python
tensorflow之tf.record实现存浮点数数组
Feb 17 #Python
Python读取表格类型文件代码实例
Feb 17 #Python
基于Python获取docx/doc文件内容代码解析
Feb 17 #Python
Python多线程获取返回值代码实例
Feb 17 #Python
You might like
基于PHP+MySQL的聊天室设计
2006/10/09 PHP
逆序二维数组插入一元素的php代码
2012/06/08 PHP
php对图像的各种处理函数代码小结
2013/07/08 PHP
PHP fastcgi模式上传大文件(大约有300多K)报错
2014/09/28 PHP
php操作(删除,提取,增加)zip文件方法详解
2015/03/12 PHP
CI框架支持$_GET的两种实现方法
2016/05/18 PHP
LaravelS通过Swoole加速Laravel/Lumen详解
2018/03/02 PHP
CI框架简单分页类用法示例
2020/06/06 PHP
Avengerls vs Newbee BO3 第一场2.18
2021/03/10 DOTA
XML+XSL 与 HTML 两种方案的结合
2007/04/22 Javascript
Javascript 遮罩层和加载效果代码
2013/08/01 Javascript
jQuery模拟新浪微博首页滚动效果的方法
2015/03/11 Javascript
js给selected添加options的方法
2015/05/06 Javascript
JavaScript面对国际化编程时的一些建议
2015/06/24 Javascript
javascript动态添加删除tabs标签的方法
2015/07/06 Javascript
PageSwitch插件实现100种不同图片切换效果
2015/07/28 Javascript
jQuery调用Webservice传递json数组的方法
2016/08/06 Javascript
Bootstrap的Carousel配合dropload.js实现移动端滑动切换图片
2017/03/10 Javascript
使用JS在浏览器中判断当前网络连接状态的几种方法
2017/05/05 Javascript
AngularJS中使用ngModal模态框实例
2017/05/27 Javascript
详解React Native顶|底部导航使用小技巧
2017/09/14 Javascript
js的函数的按值传递参数(实例讲解)
2017/11/16 Javascript
JS如何实现网站中PC端和手机端自动识别并跳转对应的代码
2020/01/08 Javascript
原生js实现密码强度验证功能
2020/03/18 Javascript
详解Python中使用base64模块来处理base64编码的方法
2016/07/01 Python
详解python之简单主机批量管理工具
2017/01/27 Python
Python面向对象程序设计之继承、多态原理与用法详解
2020/03/23 Python
如何基于windows实现python定时爬虫
2020/05/01 Python
Python获取excel内容及相关操作代码实例
2020/08/10 Python
《狼》教学反思
2014/03/02 职场文书
新闻学专业大学生职业生涯规划范文
2014/03/02 职场文书
小学生国庆节演讲稿
2014/09/05 职场文书
民主生活会对照检查材料(统计局)
2014/09/21 职场文书
幼师小班个人总结
2015/02/12 职场文书
行政前台岗位职责
2015/04/16 职场文书
幼师辞职信范文大全
2015/05/12 职场文书