多元方法 > 层次聚类
发布日期: 11/15/2021

层次聚类

使用聚类树将观测分组

聚类是将在几个变量上享有相似值的观测分组在一起的一种多元方法。它可用于您理解数据的聚簇结构。

“层次聚类”依次组合聚类。该方法首先将每个观测视为一个聚类。然后逐步将距离上最相近的两个聚类合并成一个聚类。结果被描绘成一棵树,称为系统树图

可以对不多于数万行的小数据表使用“层次聚类”。该算法占用较长时间,因此大数据表运行会很缓慢。对于较大的数据表,则使用“K 均值聚类”或“正态混合”。

注意:“层次聚类”支持字符列;“K 均值聚类”或“正态混合”要求使用数值列。

图 12.1 星座图的示例 

Image shown here

目录

“层次聚类”平台概述

对观测聚类的平台概述

聚类示例

启动“层次聚类”平台

聚类方法
计算距离的方法
数据结构
“Y,列”变量的变换

“层次聚类”报表

“系统树图”报表
系统树图和距离图的演示
“聚类历史”报表

“层次聚类”选项

“层次聚类”平台的更多示例

距离矩阵的示例
使用“空间测度”进行晶片次品分类的示例

“层次聚类”平台的统计详细信息

空间测度
距离方法公式
需要更多信息?有问题?从 JMP 用户社区得到解答 (community.jmp.com).