python词云库wordcloud的使用方法与实例详解


Posted in Python onFebruary 17, 2020

wordcloud是优秀的词云展示第三方库

python词云库wordcloud的使用方法与实例详解

一、基本使用

import jieba
import wordcloud
txt = open("1.txt", "r", encoding='utf-8').read()

words = jieba.lcut(txt)
txt_1 = " ".join(words)
# print(txt1)
w = wordcloud.WordCloud(font_path="msyh.ttc",
      width=1000, height=700, background_color="white",
      )
w.generate(txt_1)
w.to_file("ciyun.png")

二、按图片形状生成

import jieba
from wordcloud import WordCloud, STOPWORDS, ImageColorGenerator
import numpy as np
from PIL import Image

txt = open("C:/Users/96356/Desktop/1.txt", "r", encoding='utf-8').read()

words = jieba.lcut(txt)
txt_1 = " ".join(words)
photo = np.array(Image.open('C:/Users/96356/Desktop/2.png'))
# from scipy.misc import imread
# china=imread('C:/Users/96356/Desktop/2.png') #scipy.misc方式都可以读取图片

w = WordCloud(font_path="msyh.ttc",
    mask=photo,
    background_color="white",
    )
w.generate(txt_1)
w.to_file("ciyun.png")

三、WordCloud参数详解

from wordcloud import WordCloud

参数 作用
font_path 字体路径,需要展现什么字体就把该字体路径+后缀名写上,如:font_path = ‘黑体.ttf'
width 输出的画布宽度,默认为400像素
height 输出的画布高度,默认为200像素
prefer_horizontal 词语水平方向排版出现的频率,默认 0.9 (所以词语垂直方向排版出现频率为 0.1 )
mask 如果参数为空,则使用二维遮罩绘制词云。如果 mask 非空,设置的宽高值将被忽略,遮罩形状被 mask 取代。除全白(#FFFFFF)的部分将不会绘制,其余部分会用于绘制词云。如:bg_pic = imread(‘读取一张图片.png'),背景图片的画布一定要设置为白色(#FFFFFF),然后显示的形状为不是白色的其他颜色。可以用ps工具将自己要显示的形状复制到一个纯白色的画布上再保存,就ok了。一般为mask=np.array(Image.open(‘xxx.jpg'))。其中from PIL import Image
scale 按照比例进行放大画布,如设置为1.5,则长和宽都是原来画布的1.5倍
min_font_size 显示的最小的字体大小
font_step 字体步长,如果步长大于1,会加快运算但是可能导致结果出现较大的误差
max_words 要显示的词的最大个数
stopwords 设置需要屏蔽的词,如果为空,则使用内置的STOPWORDS
background_color 背景颜色,如background_color=‘white',背景颜色为白色
max_font_size 显示的最大的字体大小
mode 当参数为“RGBA”并且background_color不为空时,背景为透明
relative_scaling 词频和字体大小的关联性
color_func 生成新颜色的函数,如果为空,则使用 self.color_func
regexp 使用正则表达式分隔输入的文本
collocations 是否包括两个词的搭配
colormap 给每个单词随机分配颜色,若指定color_func,则忽略该方法
random_state 为每个单词返回一个PIL颜色

其他部分函数

函数 作用
fit_words(frequencies) 根据词频生成词云
generate(text) 根据文本生成词云
generate_from_frequencies(frequencies[, …]) 根据词频生成词云
generate_from_text(text) 根据文本生成词云
process_text(text) 将长文本分词并去除屏蔽词(此处指英语,中文分词还是需要自己用别的库先行实现,使用上面的 fit_words(frequencies) )
recolor([random_state, color_func, colormap]) 对现有输出重新着色。重新上色会比重新生成整个词云快很多
to_array() 转化为 numpy array
to_file(filename) 输出到文件

更多关于python词云库wordcloud的使用方法请查看下面的相关文章

Python 相关文章推荐
go语言计算两个时间的时间差方法
Mar 13 Python
Python最基本的输入输出详解
Apr 25 Python
六个窍门助你提高Python运行效率
Jun 09 Python
编写Python CGI脚本的教程
Jun 29 Python
Python数据结构之翻转链表
Feb 25 Python
Python实现的将文件每一列写入列表功能示例【测试可用】
Mar 19 Python
对numpy中数组元素的统一赋值实例
Apr 04 Python
Python如何将装饰器定义为类
Jul 30 Python
Python3使用Selenium获取session和token方法详解
Feb 16 Python
Python的Tqdm模块实现进度条配置
Feb 24 Python
Python if else条件语句形式详解
Mar 24 Python
Python+pyaudio实现音频控制示例详解
Jul 23 Python
tensorflow保持每次训练结果一致的简单实现
Feb 17 #Python
Python基于Socket实现简单聊天室
Feb 17 #Python
TFRecord文件查看包含的所有Features代码
Feb 17 #Python
tensorflow之tf.record实现存浮点数数组
Feb 17 #Python
Python读取表格类型文件代码实例
Feb 17 #Python
基于Python获取docx/doc文件内容代码解析
Feb 17 #Python
Python多线程获取返回值代码实例
Feb 17 #Python
You might like
PHP strncasecmp字符串比较的小技巧
2011/01/04 PHP
php 记录进行累加并显示总时长为秒的结果
2011/11/04 PHP
PHP创建word文档的方法(平台无关)
2016/03/29 PHP
Javascript 文件夹选择框的两种解决方案
2009/07/01 Javascript
JavaScript生成GUID的多种算法小结
2013/08/18 Javascript
js中的getAttribute方法使用示例
2014/08/01 Javascript
使用JavaScript进行进制转换将字符串转换为十进制
2014/09/21 Javascript
javascript实现表单提交后,提交按钮不可用的方法
2015/04/18 Javascript
JavaScript实现节点的删除与序号重建实例
2015/08/05 Javascript
详解JavaScript函数对象
2015/11/15 Javascript
使用JS实现图片展示瀑布流效果(简单实例)
2016/09/06 Javascript
js自定义瀑布流布局插件
2017/05/16 Javascript
JS实现带阴历的日历功能详解
2019/01/24 Javascript
如何通过shell脚本自动生成vue文件详解
2019/09/10 Javascript
tornado捕获和处理404错误的方法
2014/02/26 Python
利用python画一颗心的方法示例
2017/01/31 Python
详解Django中间件执行顺序
2018/07/16 Python
python3.4控制用户输入与输出的方法
2018/10/17 Python
Django REST framework内置路由用法
2019/07/26 Python
Django自定义模板过滤器和标签的实现方法
2019/08/21 Python
python可视化text()函数使用详解
2020/02/11 Python
Python实现的北京积分落户数据分析示例
2020/03/27 Python
keras的siamese(孪生网络)实现案例
2020/06/12 Python
Python新建项目自动添加介绍和utf-8编码的方法
2020/12/26 Python
python 利用matplotlib在3D空间绘制二次抛物面的案例
2021/02/06 Python
如何使用css3实现一个类在线直播的队列动画的示例代码
2020/06/17 HTML / CSS
即时搜索数百万张门票:SeatsForEveryone.com
2018/08/26 全球购物
美国快时尚彩妆品牌:Winky Lux(透明花瓣润唇膏)
2018/11/06 全球购物
工作保证书范文
2014/04/29 职场文书
触电现场处置方案
2014/05/14 职场文书
乡党政领导班子群众路线教育实践活动个人对照检查材料
2014/09/20 职场文书
2014预备党员批评与自我批评思想汇报
2014/09/20 职场文书
初中优秀学生评语
2014/12/29 职场文书
超级礼物观后感
2015/06/15 职场文书
《实心球》教学反思
2016/02/23 职场文书
MYSQL 的10大经典优化案例场景实战
2021/09/14 MySQL