python词云库wordcloud的使用方法与实例详解


Posted in Python onFebruary 17, 2020

wordcloud是优秀的词云展示第三方库

python词云库wordcloud的使用方法与实例详解

一、基本使用

import jieba
import wordcloud
txt = open("1.txt", "r", encoding='utf-8').read()

words = jieba.lcut(txt)
txt_1 = " ".join(words)
# print(txt1)
w = wordcloud.WordCloud(font_path="msyh.ttc",
      width=1000, height=700, background_color="white",
      )
w.generate(txt_1)
w.to_file("ciyun.png")

二、按图片形状生成

import jieba
from wordcloud import WordCloud, STOPWORDS, ImageColorGenerator
import numpy as np
from PIL import Image

txt = open("C:/Users/96356/Desktop/1.txt", "r", encoding='utf-8').read()

words = jieba.lcut(txt)
txt_1 = " ".join(words)
photo = np.array(Image.open('C:/Users/96356/Desktop/2.png'))
# from scipy.misc import imread
# china=imread('C:/Users/96356/Desktop/2.png') #scipy.misc方式都可以读取图片

w = WordCloud(font_path="msyh.ttc",
    mask=photo,
    background_color="white",
    )
w.generate(txt_1)
w.to_file("ciyun.png")

三、WordCloud参数详解

from wordcloud import WordCloud

参数 作用
font_path 字体路径,需要展现什么字体就把该字体路径+后缀名写上,如:font_path = ‘黑体.ttf'
width 输出的画布宽度,默认为400像素
height 输出的画布高度,默认为200像素
prefer_horizontal 词语水平方向排版出现的频率,默认 0.9 (所以词语垂直方向排版出现频率为 0.1 )
mask 如果参数为空,则使用二维遮罩绘制词云。如果 mask 非空,设置的宽高值将被忽略,遮罩形状被 mask 取代。除全白(#FFFFFF)的部分将不会绘制,其余部分会用于绘制词云。如:bg_pic = imread(‘读取一张图片.png'),背景图片的画布一定要设置为白色(#FFFFFF),然后显示的形状为不是白色的其他颜色。可以用ps工具将自己要显示的形状复制到一个纯白色的画布上再保存,就ok了。一般为mask=np.array(Image.open(‘xxx.jpg'))。其中from PIL import Image
scale 按照比例进行放大画布,如设置为1.5,则长和宽都是原来画布的1.5倍
min_font_size 显示的最小的字体大小
font_step 字体步长,如果步长大于1,会加快运算但是可能导致结果出现较大的误差
max_words 要显示的词的最大个数
stopwords 设置需要屏蔽的词,如果为空,则使用内置的STOPWORDS
background_color 背景颜色,如background_color=‘white',背景颜色为白色
max_font_size 显示的最大的字体大小
mode 当参数为“RGBA”并且background_color不为空时,背景为透明
relative_scaling 词频和字体大小的关联性
color_func 生成新颜色的函数,如果为空,则使用 self.color_func
regexp 使用正则表达式分隔输入的文本
collocations 是否包括两个词的搭配
colormap 给每个单词随机分配颜色,若指定color_func,则忽略该方法
random_state 为每个单词返回一个PIL颜色

其他部分函数

函数 作用
fit_words(frequencies) 根据词频生成词云
generate(text) 根据文本生成词云
generate_from_frequencies(frequencies[, …]) 根据词频生成词云
generate_from_text(text) 根据文本生成词云
process_text(text) 将长文本分词并去除屏蔽词(此处指英语,中文分词还是需要自己用别的库先行实现,使用上面的 fit_words(frequencies) )
recolor([random_state, color_func, colormap]) 对现有输出重新着色。重新上色会比重新生成整个词云快很多
to_array() 转化为 numpy array
to_file(filename) 输出到文件

更多关于python词云库wordcloud的使用方法请查看下面的相关文章

Python 相关文章推荐
Python中urllib2模块的8个使用细节分享
Jan 01 Python
Python使用os模块和fileinput模块来操作文件目录
Jan 19 Python
python 调用win32pai 操作cmd的方法
May 28 Python
pytorch多进程加速及代码优化方法
Aug 19 Python
利用Python小工具实现3秒钟将视频转换为音频
Oct 29 Python
python机器学习实现决策树
Nov 11 Python
利用python实现AR教程
Nov 20 Python
妙用itchat! python实现久坐提醒功能
Nov 25 Python
python中使用you-get库批量在线下载bilibili视频的教程
Mar 10 Python
python 画条形图(柱状图)实例
Apr 24 Python
pandas 操作 Excel操作总结
Mar 31 Python
Django如何创作一个简单的最小程序
May 12 Python
tensorflow保持每次训练结果一致的简单实现
Feb 17 #Python
Python基于Socket实现简单聊天室
Feb 17 #Python
TFRecord文件查看包含的所有Features代码
Feb 17 #Python
tensorflow之tf.record实现存浮点数数组
Feb 17 #Python
Python读取表格类型文件代码实例
Feb 17 #Python
基于Python获取docx/doc文件内容代码解析
Feb 17 #Python
Python多线程获取返回值代码实例
Feb 17 #Python
You might like
随机广告显示(PHP函数)
2006/10/09 PHP
用PHP即时捕捉PHP中的错误并发送email通知的实现代码
2013/01/19 PHP
php对图像的各种处理函数代码小结
2013/07/08 PHP
日常整理PHP中简单的图形处理(经典)
2015/10/26 PHP
javascript自定义startWith()和endWith()的两种方法
2013/11/11 Javascript
简单实现JS对dom操作封装
2015/12/02 Javascript
Nodejs中 npm常用命令详解
2016/07/04 NodeJs
深入浅出es6模板字符串
2017/08/26 Javascript
jQuery 实现左右两侧菜单添加、移除功能
2018/01/02 jQuery
Node.js readline 逐行读取、写入文件内容的示例
2018/03/01 Javascript
基于jQuery实现无缝轮播与左右点击效果
2018/05/13 jQuery
vue项目中,main.js,App.vue,index.html的调用方法
2018/09/20 Javascript
vue实现弹框遮罩点击其他区域弹框关闭及v-if与v-show的区别介绍
2018/09/29 Javascript
基于vue实现滚动条滚动到指定位置对应位置数字进行tween特效
2019/04/18 Javascript
vue组件化中slot的基本使用方法
2019/05/01 Javascript
python验证码识别教程之灰度处理、二值化、降噪与tesserocr识别
2018/06/04 Python
Python实现将通信达.day文件读取为DataFrame
2018/12/22 Python
Python 读取串口数据,动态绘图的示例
2019/07/02 Python
通过python改变图片特定区域的颜色详解
2019/07/15 Python
Tensorflow 定义变量,函数,数值计算等名字的更新方式
2020/02/10 Python
Django 博客实现简单的全文搜索的示例代码
2020/02/17 Python
Expected conditions模块使用方法汇总代码解析
2020/08/13 Python
python dir函数快速掌握用法技巧
2020/12/09 Python
python 制作网站小说下载器
2021/02/20 Python
详解Canvas 跨域脱坑实践
2018/11/07 HTML / CSS
HealthElement海外旗舰店:新西兰大卖场
2018/02/23 全球购物
全球精选男装和家居用品:Article
2020/04/13 全球购物
初中生物教学反思
2014/01/10 职场文书
公司踏青活动方案
2014/08/16 职场文书
小学生五一劳动节演讲稿
2015/03/18 职场文书
2015年煤矿安全工作总结
2015/05/23 职场文书
毕业生登记表班级意见
2015/06/05 职场文书
python基础之错误和异常处理
2021/10/24 Python
PHP获取学生成绩的方法
2021/11/17 PHP
weblogic服务建立数据源连接测试更新mysql驱动包的问题及解决方法
2022/01/22 MySQL
SQL SERVER存储过程用法详解
2022/02/24 SQL Server