发布日期: 04/13/2021

名义型效应的编码

在模型中输入名义型建模类型的列时,JMP 在内部将其表示为一组连续指标变量。每个变量仅采用值 –1、0 和 1。(请注意,该编码是使用指标变量对名义型变量编码的众多方法之一。)若名义型列包含 n 个水平,则需要 n-1 个这样的指标变量来表示该列。(需要 n-1 个指标变量的直接原因是:与名义型列关联的主效应具有 n-1 个自由度。)名义型因子中提供了完整的详细信息。

提示:通过从主报表的红色小三角菜单中选择“保存列”>“保存编码表”,您可以查看编码。请参见保存编码表

假定您有一个包含四个水平的名义型列。以 Cholesterol.jmp 样本数据表中的治疗列为例。治疗列包含四个水平:A、B、Control 和 Placebo。前三个水平中分别由一个指标变量表示。这些指标变量名为“治疗[A]”、“治疗[B]”和“治疗[Control]”。

给定水平的指标变量为该水平分配值 1,为最后一个水平分配 –1,为其余水平分配 0。Table 3.1显示了本例中的“治疗[A]”、“治疗[B]”和“治疗[Control]”指标变量的定义。例如,考虑指标变量“治疗[A]”。如Table 3.1所示,该变量按如下方式分配值:

值 1 分配给治疗 = A 的行

值 0 分配给治疗 = B 或 = Control 的行

值 -1 分配给治疗 = Placebo 的行

表 3.1 演示 Cholesterol.jmp 中“治疗”的指标变量 

分配给行的治疗

治疗[A]

治疗[B]

治疗[Control]

A

1

0

0

B

0

1

0

Control

0

0

1

Placebo

-1

-1

-1

水平的顺序由“值顺序”列属性决定(若已经分配该属性),或由 JMP 指定的默认排序决定。通常,默认排序对数字而言即数值排序顺序,对字符数据而言即字母数字排序顺序。不过,特定的分类值(如月份名称)会默认以适当顺序排序。有关值排序的详细信息,请参见《使用 JMP》中的值顺序

这些变量用于对模型进行参数化。它们一般不显示在数据表中,但这些变量的估计系数在“参数估计值”和其他报表中提供。尽管也可以使用其他很多编码方法,但该编码已证实是一种实用且可解释的方法。

有关名义型效应的编码的信息,请参见有序型因子

需要更多信息?有问题?从 JMP 用户社区得到解答 (community.jmp.com).