python词云库wordcloud的使用方法与实例详解


Posted in Python onFebruary 17, 2020

wordcloud是优秀的词云展示第三方库

python词云库wordcloud的使用方法与实例详解

一、基本使用

import jieba
import wordcloud
txt = open("1.txt", "r", encoding='utf-8').read()

words = jieba.lcut(txt)
txt_1 = " ".join(words)
# print(txt1)
w = wordcloud.WordCloud(font_path="msyh.ttc",
      width=1000, height=700, background_color="white",
      )
w.generate(txt_1)
w.to_file("ciyun.png")

二、按图片形状生成

import jieba
from wordcloud import WordCloud, STOPWORDS, ImageColorGenerator
import numpy as np
from PIL import Image

txt = open("C:/Users/96356/Desktop/1.txt", "r", encoding='utf-8').read()

words = jieba.lcut(txt)
txt_1 = " ".join(words)
photo = np.array(Image.open('C:/Users/96356/Desktop/2.png'))
# from scipy.misc import imread
# china=imread('C:/Users/96356/Desktop/2.png') #scipy.misc方式都可以读取图片

w = WordCloud(font_path="msyh.ttc",
    mask=photo,
    background_color="white",
    )
w.generate(txt_1)
w.to_file("ciyun.png")

三、WordCloud参数详解

from wordcloud import WordCloud

参数 作用
font_path 字体路径,需要展现什么字体就把该字体路径+后缀名写上,如:font_path = ‘黑体.ttf'
width 输出的画布宽度,默认为400像素
height 输出的画布高度,默认为200像素
prefer_horizontal 词语水平方向排版出现的频率,默认 0.9 (所以词语垂直方向排版出现频率为 0.1 )
mask 如果参数为空,则使用二维遮罩绘制词云。如果 mask 非空,设置的宽高值将被忽略,遮罩形状被 mask 取代。除全白(#FFFFFF)的部分将不会绘制,其余部分会用于绘制词云。如:bg_pic = imread(‘读取一张图片.png'),背景图片的画布一定要设置为白色(#FFFFFF),然后显示的形状为不是白色的其他颜色。可以用ps工具将自己要显示的形状复制到一个纯白色的画布上再保存,就ok了。一般为mask=np.array(Image.open(‘xxx.jpg'))。其中from PIL import Image
scale 按照比例进行放大画布,如设置为1.5,则长和宽都是原来画布的1.5倍
min_font_size 显示的最小的字体大小
font_step 字体步长,如果步长大于1,会加快运算但是可能导致结果出现较大的误差
max_words 要显示的词的最大个数
stopwords 设置需要屏蔽的词,如果为空,则使用内置的STOPWORDS
background_color 背景颜色,如background_color=‘white',背景颜色为白色
max_font_size 显示的最大的字体大小
mode 当参数为“RGBA”并且background_color不为空时,背景为透明
relative_scaling 词频和字体大小的关联性
color_func 生成新颜色的函数,如果为空,则使用 self.color_func
regexp 使用正则表达式分隔输入的文本
collocations 是否包括两个词的搭配
colormap 给每个单词随机分配颜色,若指定color_func,则忽略该方法
random_state 为每个单词返回一个PIL颜色

其他部分函数

函数 作用
fit_words(frequencies) 根据词频生成词云
generate(text) 根据文本生成词云
generate_from_frequencies(frequencies[, …]) 根据词频生成词云
generate_from_text(text) 根据文本生成词云
process_text(text) 将长文本分词并去除屏蔽词(此处指英语,中文分词还是需要自己用别的库先行实现,使用上面的 fit_words(frequencies) )
recolor([random_state, color_func, colormap]) 对现有输出重新着色。重新上色会比重新生成整个词云快很多
to_array() 转化为 numpy array
to_file(filename) 输出到文件

更多关于python词云库wordcloud的使用方法请查看下面的相关文章

Python 相关文章推荐
Python操作json数据的一个简单例子
Apr 17 Python
Python中使用socket发送HTTP请求数据接收不完整问题解决方法
Feb 04 Python
Python中处理字符串之endswith()方法的使用简介
May 18 Python
tensorflow 获取模型所有参数总和数量的方法
Jun 14 Python
python虚拟环境迁移方法
Jan 03 Python
python使用selenium登录QQ邮箱(附带滑动解锁)
Jan 23 Python
Python3.5集合及其常见运算实例详解
May 01 Python
pandas DataFrame 警告(SettingWithCopyWarning)的解决
Jul 23 Python
python为QT程序添加图标的方法详解
Mar 09 Python
基于opencv的selenium滑动验证码的实现
Jul 24 Python
python 写一个性能测试工具(一)
Oct 24 Python
python中remove函数的踩坑记录
Jan 04 Python
tensorflow保持每次训练结果一致的简单实现
Feb 17 #Python
Python基于Socket实现简单聊天室
Feb 17 #Python
TFRecord文件查看包含的所有Features代码
Feb 17 #Python
tensorflow之tf.record实现存浮点数数组
Feb 17 #Python
Python读取表格类型文件代码实例
Feb 17 #Python
基于Python获取docx/doc文件内容代码解析
Feb 17 #Python
Python多线程获取返回值代码实例
Feb 17 #Python
You might like
php中的一个中文字符串截取函数
2007/02/14 PHP
php实现jQuery扩展函数
2009/10/30 PHP
php数组函数序列之array_values() 获取数组元素值的函数与方法
2011/10/30 PHP
关于更改Zend Studio/Eclipse代码风格主题的介绍
2013/06/23 PHP
PHP使用GIFEncoder类处理gif图片实例
2014/07/01 PHP
laravel 4安装及入门图文教程
2014/10/29 PHP
PHP向浏览器输出内容的4个函数总结
2014/11/17 PHP
示例详解Laravel重置密码代码重构
2016/08/10 PHP
PHP实现数组转JSon和JSon转数组的方法示例
2018/06/14 PHP
在Laravel中使用MongoDB的方法示例
2019/11/11 PHP
你必须知道的JavaScript 中字符串连接的性能的一些问题
2013/05/07 Javascript
javaScript 计算两个日期的天数相差(示例代码)
2013/12/27 Javascript
javascript匿名函数应用示例介绍
2014/03/07 Javascript
js计算任意值之间随机数的方法
2015/01/16 Javascript
JQuery.Ajax()的data参数类型实例详解
2015/11/20 Javascript
angularjs 源码解析之injector
2016/08/22 Javascript
详解nodejs 文本操作模块-fs模块(二)
2016/12/22 NodeJs
JS简单判断滚动条的滚动方向实现方法
2017/04/28 Javascript
vue.js开发实现全局调用的MessageBox组件实例代码
2017/11/22 Javascript
JavaScript判断变量名是否存在数组中的实例
2017/12/28 Javascript
Python易忽视知识点小结
2015/05/25 Python
Python实现的手机号归属地相关信息查询功能示例
2017/06/08 Python
利用python画出折线图
2018/07/26 Python
Python简直是万能的,这5大主要用途你一定要知道!(推荐)
2019/04/03 Python
Python使用mongodb保存爬取豆瓣电影的数据过程解析
2019/08/14 Python
python的数学算法函数及公式用法
2020/11/18 Python
施华洛世奇西班牙官网:SWAROVSKI西班牙
2019/06/06 全球购物
服装设计专业自荐书范文
2013/12/30 职场文书
体育活动总结范文
2014/05/04 职场文书
社区娱乐活动方案
2014/08/21 职场文书
商务代表岗位职责
2015/02/15 职场文书
为Java项目添加Redis缓存的方法
2021/05/18 Redis
用PYTHON去计算88键钢琴的琴键频率和音高
2022/04/10 Python
使用python绘制分组对比柱状图
2022/04/21 Python
Python使用openpyxl模块处理Excel文件
2022/06/05 Python
Python可视化神器pyecharts绘制水球图
2022/07/07 Python