python词云库wordcloud的使用方法与实例详解


Posted in Python onFebruary 17, 2020

wordcloud是优秀的词云展示第三方库

python词云库wordcloud的使用方法与实例详解

一、基本使用

import jieba
import wordcloud
txt = open("1.txt", "r", encoding='utf-8').read()

words = jieba.lcut(txt)
txt_1 = " ".join(words)
# print(txt1)
w = wordcloud.WordCloud(font_path="msyh.ttc",
      width=1000, height=700, background_color="white",
      )
w.generate(txt_1)
w.to_file("ciyun.png")

二、按图片形状生成

import jieba
from wordcloud import WordCloud, STOPWORDS, ImageColorGenerator
import numpy as np
from PIL import Image

txt = open("C:/Users/96356/Desktop/1.txt", "r", encoding='utf-8').read()

words = jieba.lcut(txt)
txt_1 = " ".join(words)
photo = np.array(Image.open('C:/Users/96356/Desktop/2.png'))
# from scipy.misc import imread
# china=imread('C:/Users/96356/Desktop/2.png') #scipy.misc方式都可以读取图片

w = WordCloud(font_path="msyh.ttc",
    mask=photo,
    background_color="white",
    )
w.generate(txt_1)
w.to_file("ciyun.png")

三、WordCloud参数详解

from wordcloud import WordCloud

参数 作用
font_path 字体路径,需要展现什么字体就把该字体路径+后缀名写上,如:font_path = ‘黑体.ttf'
width 输出的画布宽度,默认为400像素
height 输出的画布高度,默认为200像素
prefer_horizontal 词语水平方向排版出现的频率,默认 0.9 (所以词语垂直方向排版出现频率为 0.1 )
mask 如果参数为空,则使用二维遮罩绘制词云。如果 mask 非空,设置的宽高值将被忽略,遮罩形状被 mask 取代。除全白(#FFFFFF)的部分将不会绘制,其余部分会用于绘制词云。如:bg_pic = imread(‘读取一张图片.png'),背景图片的画布一定要设置为白色(#FFFFFF),然后显示的形状为不是白色的其他颜色。可以用ps工具将自己要显示的形状复制到一个纯白色的画布上再保存,就ok了。一般为mask=np.array(Image.open(‘xxx.jpg'))。其中from PIL import Image
scale 按照比例进行放大画布,如设置为1.5,则长和宽都是原来画布的1.5倍
min_font_size 显示的最小的字体大小
font_step 字体步长,如果步长大于1,会加快运算但是可能导致结果出现较大的误差
max_words 要显示的词的最大个数
stopwords 设置需要屏蔽的词,如果为空,则使用内置的STOPWORDS
background_color 背景颜色,如background_color=‘white',背景颜色为白色
max_font_size 显示的最大的字体大小
mode 当参数为“RGBA”并且background_color不为空时,背景为透明
relative_scaling 词频和字体大小的关联性
color_func 生成新颜色的函数,如果为空,则使用 self.color_func
regexp 使用正则表达式分隔输入的文本
collocations 是否包括两个词的搭配
colormap 给每个单词随机分配颜色,若指定color_func,则忽略该方法
random_state 为每个单词返回一个PIL颜色

其他部分函数

函数 作用
fit_words(frequencies) 根据词频生成词云
generate(text) 根据文本生成词云
generate_from_frequencies(frequencies[, …]) 根据词频生成词云
generate_from_text(text) 根据文本生成词云
process_text(text) 将长文本分词并去除屏蔽词(此处指英语,中文分词还是需要自己用别的库先行实现,使用上面的 fit_words(frequencies) )
recolor([random_state, color_func, colormap]) 对现有输出重新着色。重新上色会比重新生成整个词云快很多
to_array() 转化为 numpy array
to_file(filename) 输出到文件

更多关于python词云库wordcloud的使用方法请查看下面的相关文章

Python 相关文章推荐
python获取图片颜色信息的方法
Mar 18 Python
Python自动化部署工具Fabric的简单上手指南
Apr 19 Python
Python3.5编程实现修改IIS WEB.CONFIG的方法示例
Aug 18 Python
详解python如何在django中为用户模型添加自定义权限
Oct 15 Python
Django model序列化为json的方法示例
Oct 16 Python
解决python 自动安装缺少模块的问题
Oct 22 Python
python运用sklearn实现KNN分类算法
Oct 16 Python
Python3.x+迅雷x 自动下载高分电影的实现方法
Jan 12 Python
keras的siamese(孪生网络)实现案例
Jun 12 Python
python怎么判断素数
Jul 01 Python
Django-simple-captcha验证码包使用方法详解
Nov 28 Python
利用Python读取微信朋友圈的多种方法总结
Aug 23 Python
tensorflow保持每次训练结果一致的简单实现
Feb 17 #Python
Python基于Socket实现简单聊天室
Feb 17 #Python
TFRecord文件查看包含的所有Features代码
Feb 17 #Python
tensorflow之tf.record实现存浮点数数组
Feb 17 #Python
Python读取表格类型文件代码实例
Feb 17 #Python
基于Python获取docx/doc文件内容代码解析
Feb 17 #Python
Python多线程获取返回值代码实例
Feb 17 #Python
You might like
PHP+AJAX实现无刷新注册(带用户名实时检测)
2006/12/02 PHP
PHP JSON格式数据交互实例代码详解
2011/01/13 PHP
php实现的农历算法实例
2015/08/11 PHP
PHP处理数组和XML之间的互相转换
2016/06/02 PHP
WordPress伪静态规则设置代码实例
2020/12/10 PHP
JQuery 插件模板 制作jquery插件的朋友可以参考下
2010/03/17 Javascript
jQuery maxlength文本字数限制插件
2010/04/16 Javascript
jQuery 中使用JSON的实现代码
2011/12/01 Javascript
javascript运行机制之this详细介绍
2014/02/07 Javascript
判断及设置浏览器全屏模式
2014/04/20 Javascript
node.js中的buffer.Buffer.byteLength方法使用说明
2014/12/10 Javascript
jQuery中slideUp 和 slideDown 的点击事件
2015/02/26 Javascript
探讨JavaScript标签位置的存放与功能有无关系
2016/01/15 Javascript
javascript中arguments,callee,caller详解
2016/03/16 Javascript
基于JS实现横线提示输入验证码随验证码输入消失(js验证码的实现)
2016/10/27 Javascript
jquery实现(textarea)placeholder自动换行
2016/12/22 Javascript
jQuery基本筛选选择器实例代码
2017/02/06 Javascript
详解Vue.js组件可复用性的混合(mixin)方式和自定义指令
2017/09/06 Javascript
解决JQuery全选/反选第二次失效的问题
2017/10/11 jQuery
JS逻辑运算符短路操作实例分析
2018/07/09 Javascript
微信小程序 确认框的实现(附代码)
2019/07/23 Javascript
vuex 多模块时 模块内部的mutation和action的调用方式
2020/07/24 Javascript
vue3.0实现点击切换验证码(组件)及校验
2020/11/18 Vue.js
pyspark 读取csv文件创建DataFrame的两种方法
2018/06/07 Python
python leetcode 字符串相乘实例详解
2018/09/03 Python
python多线程实现TCP服务端
2019/09/03 Python
爬虫代理池Python3WebSpider源代码测试过程解析
2019/12/20 Python
业务副厂长岗位职责
2014/01/03 职场文书
水利学院求职自荐书
2014/02/01 职场文书
大学生素质拓展活动方案
2014/02/11 职场文书
闭幕式主持词
2014/04/02 职场文书
保护环境建议书300字
2014/05/13 职场文书
自主招生英文自荐信
2015/03/25 职场文书
MySQL数字类型自增的坑
2021/05/07 MySQL
使用Oracle跟踪文件的问题详解
2021/06/28 Oracle
openstack云计算keystone组件工作介绍
2022/04/20 Servers