python词云库wordcloud的使用方法与实例详解


Posted in Python onFebruary 17, 2020

wordcloud是优秀的词云展示第三方库

python词云库wordcloud的使用方法与实例详解

一、基本使用

import jieba
import wordcloud
txt = open("1.txt", "r", encoding='utf-8').read()

words = jieba.lcut(txt)
txt_1 = " ".join(words)
# print(txt1)
w = wordcloud.WordCloud(font_path="msyh.ttc",
      width=1000, height=700, background_color="white",
      )
w.generate(txt_1)
w.to_file("ciyun.png")

二、按图片形状生成

import jieba
from wordcloud import WordCloud, STOPWORDS, ImageColorGenerator
import numpy as np
from PIL import Image

txt = open("C:/Users/96356/Desktop/1.txt", "r", encoding='utf-8').read()

words = jieba.lcut(txt)
txt_1 = " ".join(words)
photo = np.array(Image.open('C:/Users/96356/Desktop/2.png'))
# from scipy.misc import imread
# china=imread('C:/Users/96356/Desktop/2.png') #scipy.misc方式都可以读取图片

w = WordCloud(font_path="msyh.ttc",
    mask=photo,
    background_color="white",
    )
w.generate(txt_1)
w.to_file("ciyun.png")

三、WordCloud参数详解

from wordcloud import WordCloud

参数 作用
font_path 字体路径,需要展现什么字体就把该字体路径+后缀名写上,如:font_path = ‘黑体.ttf'
width 输出的画布宽度,默认为400像素
height 输出的画布高度,默认为200像素
prefer_horizontal 词语水平方向排版出现的频率,默认 0.9 (所以词语垂直方向排版出现频率为 0.1 )
mask 如果参数为空,则使用二维遮罩绘制词云。如果 mask 非空,设置的宽高值将被忽略,遮罩形状被 mask 取代。除全白(#FFFFFF)的部分将不会绘制,其余部分会用于绘制词云。如:bg_pic = imread(‘读取一张图片.png'),背景图片的画布一定要设置为白色(#FFFFFF),然后显示的形状为不是白色的其他颜色。可以用ps工具将自己要显示的形状复制到一个纯白色的画布上再保存,就ok了。一般为mask=np.array(Image.open(‘xxx.jpg'))。其中from PIL import Image
scale 按照比例进行放大画布,如设置为1.5,则长和宽都是原来画布的1.5倍
min_font_size 显示的最小的字体大小
font_step 字体步长,如果步长大于1,会加快运算但是可能导致结果出现较大的误差
max_words 要显示的词的最大个数
stopwords 设置需要屏蔽的词,如果为空,则使用内置的STOPWORDS
background_color 背景颜色,如background_color=‘white',背景颜色为白色
max_font_size 显示的最大的字体大小
mode 当参数为“RGBA”并且background_color不为空时,背景为透明
relative_scaling 词频和字体大小的关联性
color_func 生成新颜色的函数,如果为空,则使用 self.color_func
regexp 使用正则表达式分隔输入的文本
collocations 是否包括两个词的搭配
colormap 给每个单词随机分配颜色,若指定color_func,则忽略该方法
random_state 为每个单词返回一个PIL颜色

其他部分函数

函数 作用
fit_words(frequencies) 根据词频生成词云
generate(text) 根据文本生成词云
generate_from_frequencies(frequencies[, …]) 根据词频生成词云
generate_from_text(text) 根据文本生成词云
process_text(text) 将长文本分词并去除屏蔽词(此处指英语,中文分词还是需要自己用别的库先行实现,使用上面的 fit_words(frequencies) )
recolor([random_state, color_func, colormap]) 对现有输出重新着色。重新上色会比重新生成整个词云快很多
to_array() 转化为 numpy array
to_file(filename) 输出到文件

更多关于python词云库wordcloud的使用方法请查看下面的相关文章

Python 相关文章推荐
Python查看多台服务器进程的脚本分享
Jun 11 Python
Python编码爬坑指南(必看)
Jun 10 Python
基于python爬虫数据处理(详解)
Jun 10 Python
Python实现模拟分割大文件及多线程处理的方法
Oct 10 Python
Python(Django)项目与Apache的管理交互的方法
May 16 Python
快速解决PyCharm无法引用matplotlib的问题
May 24 Python
python读取txt文件,去掉空格计算每行长度的方法
Dec 20 Python
python实现两张图片的像素融合
Feb 23 Python
python中的socket实现ftp客户端和服务器收发文件及md5加密文件
Apr 01 Python
Python分析微信好友性别比例和省份城市分布比例的方法示例【基于itchat模块】
May 29 Python
使用SimpleITK读取和保存NIfTI/DICOM文件实例
Jul 01 Python
python解包概念及实例
Feb 17 Python
tensorflow保持每次训练结果一致的简单实现
Feb 17 #Python
Python基于Socket实现简单聊天室
Feb 17 #Python
TFRecord文件查看包含的所有Features代码
Feb 17 #Python
tensorflow之tf.record实现存浮点数数组
Feb 17 #Python
Python读取表格类型文件代码实例
Feb 17 #Python
基于Python获取docx/doc文件内容代码解析
Feb 17 #Python
Python多线程获取返回值代码实例
Feb 17 #Python
You might like
基于php使用memcache存储session的详解
2013/06/25 PHP
PHP向socket服务器收发数据的方法
2015/01/24 PHP
php遍历CSV类实例
2015/04/14 PHP
一些mootools的学习资源
2010/02/07 Javascript
仅Firefox中链接A无法实现模拟点击以触发其默认行为
2011/07/31 Javascript
jQuery调取jSon数据并展示的方法
2015/01/29 Javascript
JavaScript从数组中删除指定值元素的方法
2015/03/18 Javascript
Jquery使用val方法读写value值
2015/05/18 Javascript
浅谈jQuery.easyui的datebox格式化时间
2015/06/25 Javascript
jQuery移动web开发中的页面初始化与加载事件
2015/12/03 Javascript
文件上传的几个示例分享【推荐】
2016/12/16 Javascript
react.js CMS 删除功能的实现方法
2017/04/17 Javascript
微信小程序单选radio及多选checkbox按钮用法示例
2019/04/30 Javascript
JavaScript中的ES6 Proxy的具体使用
2019/06/16 Javascript
js+html实现点名系统功能
2019/11/05 Javascript
关于JavaScript数组去重的一些理解汇总
2020/09/10 Javascript
python3 打开外部程序及关闭的示例
2018/11/06 Python
Python pandas.DataFrame调整列顺序及修改index名的方法
2019/06/21 Python
pytorch torch.nn.AdaptiveAvgPool2d()自适应平均池化函数详解
2020/01/03 Python
Python读取文件内容为字符串的方法(多种方法详解)
2020/03/04 Python
python中adb有什么功能
2020/06/07 Python
Python 如何定义匿名或内联函数
2020/08/01 Python
CSS3实现DIV圆角效果完整代码
2012/10/10 HTML / CSS
HTML5中使用postMessage实现Ajax跨域请求的方法
2016/04/19 HTML / CSS
戴尔美国官方折扣店:Dell Outlet
2018/02/13 全球购物
Linux内核产生并发的原因
2016/11/08 面试题
岗位职责定义及内容
2013/11/08 职场文书
2014年百日安全生产活动总结
2014/05/04 职场文书
职位说明书范文
2014/05/07 职场文书
春节联欢会策划方案
2014/05/16 职场文书
工商管理自荐书
2014/07/06 职场文书
写给医院的感谢信
2015/01/22 职场文书
2015年信访维稳工作总结
2015/04/07 职场文书
修辞手法有哪些?
2019/08/29 职场文书
vue项目两种方式实现竖向表格的思路分析
2021/04/28 Vue.js
SpringBoot项目中控制台日志的保存配置操作
2021/06/18 Java/Android