python词云库wordcloud的使用方法与实例详解


Posted in Python onFebruary 17, 2020

wordcloud是优秀的词云展示第三方库

python词云库wordcloud的使用方法与实例详解

一、基本使用

import jieba
import wordcloud
txt = open("1.txt", "r", encoding='utf-8').read()

words = jieba.lcut(txt)
txt_1 = " ".join(words)
# print(txt1)
w = wordcloud.WordCloud(font_path="msyh.ttc",
      width=1000, height=700, background_color="white",
      )
w.generate(txt_1)
w.to_file("ciyun.png")

二、按图片形状生成

import jieba
from wordcloud import WordCloud, STOPWORDS, ImageColorGenerator
import numpy as np
from PIL import Image

txt = open("C:/Users/96356/Desktop/1.txt", "r", encoding='utf-8').read()

words = jieba.lcut(txt)
txt_1 = " ".join(words)
photo = np.array(Image.open('C:/Users/96356/Desktop/2.png'))
# from scipy.misc import imread
# china=imread('C:/Users/96356/Desktop/2.png') #scipy.misc方式都可以读取图片

w = WordCloud(font_path="msyh.ttc",
    mask=photo,
    background_color="white",
    )
w.generate(txt_1)
w.to_file("ciyun.png")

三、WordCloud参数详解

from wordcloud import WordCloud

参数 作用
font_path 字体路径,需要展现什么字体就把该字体路径+后缀名写上,如:font_path = ‘黑体.ttf'
width 输出的画布宽度,默认为400像素
height 输出的画布高度,默认为200像素
prefer_horizontal 词语水平方向排版出现的频率,默认 0.9 (所以词语垂直方向排版出现频率为 0.1 )
mask 如果参数为空,则使用二维遮罩绘制词云。如果 mask 非空,设置的宽高值将被忽略,遮罩形状被 mask 取代。除全白(#FFFFFF)的部分将不会绘制,其余部分会用于绘制词云。如:bg_pic = imread(‘读取一张图片.png'),背景图片的画布一定要设置为白色(#FFFFFF),然后显示的形状为不是白色的其他颜色。可以用ps工具将自己要显示的形状复制到一个纯白色的画布上再保存,就ok了。一般为mask=np.array(Image.open(‘xxx.jpg'))。其中from PIL import Image
scale 按照比例进行放大画布,如设置为1.5,则长和宽都是原来画布的1.5倍
min_font_size 显示的最小的字体大小
font_step 字体步长,如果步长大于1,会加快运算但是可能导致结果出现较大的误差
max_words 要显示的词的最大个数
stopwords 设置需要屏蔽的词,如果为空,则使用内置的STOPWORDS
background_color 背景颜色,如background_color=‘white',背景颜色为白色
max_font_size 显示的最大的字体大小
mode 当参数为“RGBA”并且background_color不为空时,背景为透明
relative_scaling 词频和字体大小的关联性
color_func 生成新颜色的函数,如果为空,则使用 self.color_func
regexp 使用正则表达式分隔输入的文本
collocations 是否包括两个词的搭配
colormap 给每个单词随机分配颜色,若指定color_func,则忽略该方法
random_state 为每个单词返回一个PIL颜色

其他部分函数

函数 作用
fit_words(frequencies) 根据词频生成词云
generate(text) 根据文本生成词云
generate_from_frequencies(frequencies[, …]) 根据词频生成词云
generate_from_text(text) 根据文本生成词云
process_text(text) 将长文本分词并去除屏蔽词(此处指英语,中文分词还是需要自己用别的库先行实现,使用上面的 fit_words(frequencies) )
recolor([random_state, color_func, colormap]) 对现有输出重新着色。重新上色会比重新生成整个词云快很多
to_array() 转化为 numpy array
to_file(filename) 输出到文件

更多关于python词云库wordcloud的使用方法请查看下面的相关文章

Python 相关文章推荐
详细解读Python的web.py框架下的application.py模块
May 02 Python
python通过文件头判断文件类型
Oct 30 Python
python3.6 实现AES加密的示例(pyCryptodome)
Jan 10 Python
python3 破解 geetest(极验)的滑块验证码功能
Feb 24 Python
Python常用字符串替换函数strip、replace及sub用法示例
May 21 Python
python 实现手机自动拨打电话的方法(通话压力测试)
Aug 08 Python
python协程gevent案例 爬取斗鱼图片过程解析
Aug 27 Python
Spring Cloud Feign高级应用实例详解
Dec 10 Python
python plotly画柱状图代码实例
Dec 13 Python
python tkinter GUI绘制,以及点击更新显示图片代码
Mar 14 Python
基于打开pycharm有带图片md文件卡死问题的解决
Apr 24 Python
python实现KNN近邻算法
Dec 30 Python
tensorflow保持每次训练结果一致的简单实现
Feb 17 #Python
Python基于Socket实现简单聊天室
Feb 17 #Python
TFRecord文件查看包含的所有Features代码
Feb 17 #Python
tensorflow之tf.record实现存浮点数数组
Feb 17 #Python
Python读取表格类型文件代码实例
Feb 17 #Python
基于Python获取docx/doc文件内容代码解析
Feb 17 #Python
Python多线程获取返回值代码实例
Feb 17 #Python
You might like
第十节 抽象方法和抽象类 [10]
2006/10/09 PHP
一个多文件上传的例子(原创)
2006/10/09 PHP
PHP 超链接 抓取实现代码
2009/06/29 PHP
php smarty模版引擎中变量操作符及使用方法
2009/12/11 PHP
php file_get_contents函数轻松采集html数据
2010/04/22 PHP
php数据结构与算法(PHP描述) 快速排序 quick sort
2012/06/21 PHP
php中存储用户ID和密码到mysql数据库的方法
2013/02/06 PHP
php发送与接收流文件的方法
2015/02/11 PHP
PHP通过加锁实现并发情况下抢码功能
2016/08/10 PHP
php基于自定义函数记录log日志方法
2017/07/21 PHP
clientX,pageX,offsetX,x,layerX,screenX,offsetLeft区别分析
2010/03/12 Javascript
IE下支持文本框和密码框placeholder效果的JQuery插件分享
2015/01/31 Javascript
解决JS无法调用Controller问题的方法
2015/12/31 Javascript
javascript的正则匹配方法学习
2016/02/24 Javascript
JS中位置与大小的获取方法
2016/11/22 Javascript
Puppet的一些技巧
2018/09/17 Javascript
[01:00:44]DOTA2上海特级锦标赛主赛事日 - 3 败者组第三轮#1COL VS Alliance第三局
2016/03/04 DOTA
Python的ORM框架SQLObject入门实例
2014/04/28 Python
Python 正则表达式入门(初级篇)
2016/12/07 Python
Django框架ORM数据库操作实例详解
2019/11/07 Python
python打开音乐文件的实例方法
2020/07/21 Python
Python‘==‘ 及 ‘is‘相关原理解析
2020/09/05 Python
Lombok插件安装(IDEA)及配置jar包使用详解
2020/11/04 Python
python中编写函数并调用的知识点总结
2021/01/13 Python
canvas小画板之平滑曲线的实现
2020/08/12 HTML / CSS
华为俄罗斯官方网上商城:购买Huawei手机和平板
2017/04/21 全球购物
澳大利亚最超值的自行车之家:Reid Cycles
2019/03/24 全球购物
关于Assembly命名空间的三个面试题
2015/07/23 面试题
程序员机试试题汇总
2012/03/07 面试题
中文系师范生自荐信
2013/10/01 职场文书
优秀求职信范文分享
2013/12/19 职场文书
成品仓管员工作职责
2013/12/29 职场文书
韩国商务邀请函
2014/01/14 职场文书
个人现实表现材料
2014/02/04 职场文书
2015年大学生暑期实习报告
2015/07/13 职场文书
JavaScript嵌入百度地图API的最详细方法
2021/04/16 Javascript