Python实现简单层次聚类算法以及可视化


Posted in Python onMarch 18, 2019

本文实例为大家分享了Python实现简单层次聚类算法,以及可视化,供大家参考,具体内容如下

基本的算法思路就是:把当前组间距离最小的两组合并成一组。

算法的差异在算法如何确定组件的距离,一般有最大距离,最小距离,平均距离,马氏距离等等。

代码如下:

import numpy as np
import data_helper
np.random.seed(1)
def get_raw_data(n):
 _data=np.random.rand(n,2)
 #生成数据的格式是n个(x,y)
 _groups={idx:[[x,y]] for idx,(x,y) in enumerate(_data)}
 return _groups
def cal_distance(cluster1,cluster2):
 #采用最小距离作为聚类标准
 _min_distance=10000
 for x1,y1 in cluster1:
  for x2,y2 in cluster2:
   _distance=(x1-x2)**2+(y1-y2)**2
   if _distance<_min_distance:
    _min_distance=_distance
 return _distance
groups=get_raw_data(10)
count=0
while len(groups)!=1:#判断是不是所有的数据是不是归为了同一类
 min_distance=10000
 len_groups=len(groups)
 
 for i in groups.keys():
  for j in groups.keys():
   if i>=j:
    continue
   distance=cal_distance(groups[i],groups[j])
   if distance<min_distance:
    min_distance=distance
    min_i=i
    min_j=j#这里的j>i
 groups[min_i].extend(groups.pop(min_j))
 data_helper.draw_data(groups)
 #一共n个簇,共迭代n-1次

运行的效果就是迭代一次,组数就会少一次,调用画图方法,同一组的数据被显示为一个颜色。

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python标准库之Sys模块使用详解
May 23 Python
Python读大数据txt
Mar 28 Python
flask中使用蓝图将路由分开写在不同文件实例解析
Jan 19 Python
用python建立两个Y轴的XY曲线图方法
Jul 08 Python
django使用haystack调用Elasticsearch实现索引搜索
Jul 24 Python
win10下安装Anaconda的教程(python环境+jupyter_notebook)
Oct 23 Python
python获取array中指定元素的示例
Nov 26 Python
Pytorch的mean和std调查实例
Jan 02 Python
django为Form生成的label标签添加class方式
May 20 Python
Python如何解除一个装饰器
Aug 07 Python
C++和python实现阿姆斯特朗数字查找实例代码
Dec 07 Python
给numpy.array增加维度的超简单方法
Jun 02 Python
PyQt5实现简单数据标注工具
Mar 18 #Python
Python简单I/O操作示例
Mar 18 #Python
python实现简单图片物体标注工具
Mar 18 #Python
Python面向对象程序设计之类的定义与继承简单示例
Mar 18 #Python
Python动态赋值的陷阱知识点总结
Mar 17 #Python
Python将字符串常量转化为变量方法总结
Mar 17 #Python
实例讲解Python中整数的最大值输出
Mar 17 #Python
You might like
PHP图片裁剪函数(保持图像不变形)
2014/05/04 PHP
Symfony2创建页面实例详解
2016/03/18 PHP
php页面跳转session cookie丢失导致不能登录等问题的解决方法
2016/12/12 PHP
PHP处理Ajax请求与Ajax跨域问题
2017/02/13 PHP
php-app开发接口加密详解
2018/04/18 PHP
windows 2008r2+php5.6.28环境搭建详细过程
2019/06/18 PHP
JavaScript 版本自动生成文章摘要
2008/07/23 Javascript
javascript各种复制代码收集
2008/09/20 Javascript
jQuery 网易相册鼠标移动显示隐藏效果实现代码
2013/03/31 Javascript
jquery基础教程之数组使用详解
2014/03/10 Javascript
js获取当前日期时间及其它操作汇总
2015/04/17 Javascript
javascript实现控制文字大中小显示
2015/04/28 Javascript
js实现将选中值累加到文本框的方法
2015/08/12 Javascript
javascript实现base64 md5 sha1 密码加密
2015/09/09 Javascript
基于JQuery实现仿网易邮箱全屏动感滚动插件fullPage
2015/09/20 Javascript
js仿微博实现统计字符和本地存储功能
2015/12/22 Javascript
JS实现点击循环切换显示内容的方法
2017/10/19 Javascript
nodejs读取并去重excel文件
2018/04/22 NodeJs
详解webpack之图片引入-增强的file-loader:url-loader
2018/10/08 Javascript
JS实现页面跳转与刷新的方法汇总
2019/08/30 Javascript
JS使用H5实现图片预览功能
2019/09/30 Javascript
vue控制多行文字展开收起的实现示例
2019/10/11 Javascript
python之模拟鼠标键盘动作具体实现
2013/12/30 Python
Python数据类型详解(二)列表
2016/05/08 Python
Python基于辗转相除法求解最大公约数的方法示例
2018/04/04 Python
python flask框架实现传数据到js的方法分析
2019/06/11 Python
Python qrcode 生成一个二维码的实例详解
2020/02/12 Python
python3中calendar返回某一时间点实例讲解
2020/11/18 Python
使用python爬取抖音app视频的实例代码
2020/12/01 Python
Python3.9.1中使用split()的处理方法(推荐)
2021/02/07 Python
纯CSS打造(无图像无js)的非常流行的讲话(语音)气泡效果
2012/12/28 HTML / CSS
Canvas与图片压缩的示例代码
2017/11/28 HTML / CSS
美国大尺码女装零售商:TORRID
2016/10/01 全球购物
2015年班级元旦晚会活动总结
2014/11/28 职场文书
2015年党风廉政建设责任书
2015/01/29 职场文书
ORACLE查看当前账号的相关信息
2021/06/18 Oracle