j = 1, ..., J 表示响应的观测列。它们是“潜在类分析”平台启动窗口中的 Y 列。列 j 的水平数表示为 Rj
J 个变量的多维列联表包含 W = R1*...*RJ 个单元格。其中的每一个单元格依据其针对 J 个变量的响应模式来定义。因此,每个响应模式是形式为 y = y1, ..., yjJ-长度向量。将 Y 定义为所有响应模式视为行向量的 J x W 数组。Y 中的每行 yw 具有概率 Pr(yw)。这些概率之和为 1:
C 是潜在类模型中的聚类数。
γc 是聚类 c 中成员关系的概率。(γc 是潜在类流行度。)这些参数之和为 1。
rj,k 是第 j 个响应的第 k 个水平。
ρj,k|c 是以类 c 中的成员关系为条件在列 j 中观测到响应 rj,k 的概率。(ρj,k|c 是项目响应概率。)对于给定的聚类和响应变量 jρj,k|c 之和为 1。
I( yj = rj,k ) 是指标函数,当 yj 响应为第 j 个响应的第 k 个水平时该函数等于 1,其他情况下该函数等于 0。
观测到响应 yw = y1, ..., yj 的特定向量的概率是观测到每个 C 潜在类的响应向量的条件概率之和。
该方程是您从“潜在类分析”红色小三角菜单中选择“保存混合和聚类公式”选项时保存至数据表的 Prob Formula Cluster 公式的分母。Prob Formula Cluster 列中的公式给出 Pr(聚类 = c | yw),其等于 Pr(yw, 聚类 = c) / Pr(yw)。
潜在类模型的 γρ 参数使用迭代期望值最大化 (EM) 算法估计得到。潜在类模型中的唯一参数个数定义如下: