python词云库wordcloud的使用方法与实例详解


Posted in Python onFebruary 17, 2020

wordcloud是优秀的词云展示第三方库

python词云库wordcloud的使用方法与实例详解

一、基本使用

import jieba
import wordcloud
txt = open("1.txt", "r", encoding='utf-8').read()

words = jieba.lcut(txt)
txt_1 = " ".join(words)
# print(txt1)
w = wordcloud.WordCloud(font_path="msyh.ttc",
      width=1000, height=700, background_color="white",
      )
w.generate(txt_1)
w.to_file("ciyun.png")

二、按图片形状生成

import jieba
from wordcloud import WordCloud, STOPWORDS, ImageColorGenerator
import numpy as np
from PIL import Image

txt = open("C:/Users/96356/Desktop/1.txt", "r", encoding='utf-8').read()

words = jieba.lcut(txt)
txt_1 = " ".join(words)
photo = np.array(Image.open('C:/Users/96356/Desktop/2.png'))
# from scipy.misc import imread
# china=imread('C:/Users/96356/Desktop/2.png') #scipy.misc方式都可以读取图片

w = WordCloud(font_path="msyh.ttc",
    mask=photo,
    background_color="white",
    )
w.generate(txt_1)
w.to_file("ciyun.png")

三、WordCloud参数详解

from wordcloud import WordCloud

参数 作用
font_path 字体路径,需要展现什么字体就把该字体路径+后缀名写上,如:font_path = ‘黑体.ttf'
width 输出的画布宽度,默认为400像素
height 输出的画布高度,默认为200像素
prefer_horizontal 词语水平方向排版出现的频率,默认 0.9 (所以词语垂直方向排版出现频率为 0.1 )
mask 如果参数为空,则使用二维遮罩绘制词云。如果 mask 非空,设置的宽高值将被忽略,遮罩形状被 mask 取代。除全白(#FFFFFF)的部分将不会绘制,其余部分会用于绘制词云。如:bg_pic = imread(‘读取一张图片.png'),背景图片的画布一定要设置为白色(#FFFFFF),然后显示的形状为不是白色的其他颜色。可以用ps工具将自己要显示的形状复制到一个纯白色的画布上再保存,就ok了。一般为mask=np.array(Image.open(‘xxx.jpg'))。其中from PIL import Image
scale 按照比例进行放大画布,如设置为1.5,则长和宽都是原来画布的1.5倍
min_font_size 显示的最小的字体大小
font_step 字体步长,如果步长大于1,会加快运算但是可能导致结果出现较大的误差
max_words 要显示的词的最大个数
stopwords 设置需要屏蔽的词,如果为空,则使用内置的STOPWORDS
background_color 背景颜色,如background_color=‘white',背景颜色为白色
max_font_size 显示的最大的字体大小
mode 当参数为“RGBA”并且background_color不为空时,背景为透明
relative_scaling 词频和字体大小的关联性
color_func 生成新颜色的函数,如果为空,则使用 self.color_func
regexp 使用正则表达式分隔输入的文本
collocations 是否包括两个词的搭配
colormap 给每个单词随机分配颜色,若指定color_func,则忽略该方法
random_state 为每个单词返回一个PIL颜色

其他部分函数

函数 作用
fit_words(frequencies) 根据词频生成词云
generate(text) 根据文本生成词云
generate_from_frequencies(frequencies[, …]) 根据词频生成词云
generate_from_text(text) 根据文本生成词云
process_text(text) 将长文本分词并去除屏蔽词(此处指英语,中文分词还是需要自己用别的库先行实现,使用上面的 fit_words(frequencies) )
recolor([random_state, color_func, colormap]) 对现有输出重新着色。重新上色会比重新生成整个词云快很多
to_array() 转化为 numpy array
to_file(filename) 输出到文件

更多关于python词云库wordcloud的使用方法请查看下面的相关文章

Python 相关文章推荐
python函数参数*args**kwargs用法实例
Dec 04 Python
Python使用htpasswd实现基本认证授权的例子
Jun 10 Python
Python列表(list)、字典(dict)、字符串(string)基本操作小结
Nov 28 Python
关于numpy中np.nonzero()函数用法的详解
Feb 07 Python
对Python3中的input函数详解
Apr 22 Python
Python实现FTP文件传输的实例
Jul 07 Python
在Python中字符串、列表、元组、字典之间的相互转换
Nov 15 Python
Python读取csv文件实例解析
Dec 30 Python
Python基础之函数原理与应用实例详解
Jan 03 Python
Python chardet库识别编码原理解析
Feb 18 Python
pytorch 实现在一个优化器中设置多个网络参数的例子
Feb 20 Python
使用python创建Excel工作簿及工作表过程图解
May 27 Python
tensorflow保持每次训练结果一致的简单实现
Feb 17 #Python
Python基于Socket实现简单聊天室
Feb 17 #Python
TFRecord文件查看包含的所有Features代码
Feb 17 #Python
tensorflow之tf.record实现存浮点数数组
Feb 17 #Python
Python读取表格类型文件代码实例
Feb 17 #Python
基于Python获取docx/doc文件内容代码解析
Feb 17 #Python
Python多线程获取返回值代码实例
Feb 17 #Python
You might like
thinkphp3.2中Lite文件替换框架入口文件或应用入口文件的方法
2015/05/21 PHP
JavaScript 对象模型 执行模型
2010/10/15 Javascript
Javascript中产生固定结果的函数优化技巧
2013/01/16 Javascript
基于jquery的has()方法以及与find()方法以及filter()方法的区别详解
2013/04/26 Javascript
JS获取屏幕,浏览器窗口大小,网页高度宽度(实现代码)
2013/12/17 Javascript
jquery实现一个简单好用的弹出框
2014/09/26 Javascript
ES6中非常实用的新特性介绍
2016/03/10 Javascript
全面解析DOM操作和jQuery实现选项移动操作代码分享
2016/06/07 Javascript
由浅入深剖析Angular表单验证
2016/07/14 Javascript
微信小程序购物商城系统开发系列-工具篇的介绍
2016/11/21 Javascript
JS中用childNodes获取子元素换行会产生一个子元素
2016/12/08 Javascript
利用JS实现简单的日期选择插件
2017/01/23 Javascript
简单易懂的天气插件(代码分享)
2017/02/04 Javascript
BootStrap table删除指定行的注意事项(笔记整理)
2017/02/05 Javascript
JavaScript设计模式之享元模式实例详解
2019/01/17 Javascript
微信小程序上传多图到服务器并获取返回的路径
2019/05/05 Javascript
javascript简单实现深浅拷贝过程详解
2019/10/08 Javascript
[01:13:46]iG vs Winstrike 2018国际邀请赛小组赛BO2 第一场 8.16
2018/08/17 DOTA
Python爬虫DOTA排行榜爬取实例(分享)
2017/06/13 Python
Python实现的单向循环链表功能示例
2017/11/10 Python
python 在屏幕上逐字显示一行字的实例
2018/12/24 Python
Python爬虫库BeautifulSoup的介绍与简单使用实例
2020/01/25 Python
python scatter函数用法实例详解
2020/02/11 Python
读取nii或nii.gz文件中的信息即输出图像操作
2020/07/01 Python
HTML5 贪吃蛇游戏实现思路及源代码
2013/09/03 HTML / CSS
什么是Web Service?
2012/07/25 面试题
护理不良事件检讨书
2014/02/06 职场文书
楼面经理岗位职责范本
2014/02/18 职场文书
企业节能减排实施方案
2014/03/19 职场文书
出国留学经济担保书
2014/04/01 职场文书
毕业生班级鉴定评语
2015/01/04 职场文书
英语教学课后反思
2016/02/15 职场文书
python 用递归实现通用爬虫解析器
2021/04/16 Python
JavaScript 定时器详情
2021/11/11 Javascript
MySQL安装失败的原因及解决步骤
2022/06/14 MySQL
Docker与K8s关系介绍不会Docker也可以使用K8s
2022/06/25 Servers