單因子變異數分析

什麼是單因子變異數分析 (ANOVA)?

單因子變異數分析 (ANOVA) 是一種用於檢定三種以上群組平均數差異的統計方法。

如何運用單因子變異數分析 (ANOVA)?

當您有單一獨立變異數或 因子,且目標是查證變異數或不同 程度 的因子是否對應變數造成可衡量的影響時,可以使用單因子變異數分析 (ANOVA)。

需要考量的限制有哪些?

單因子變異數分析,只能用於查證單一因子與單一應變數。比較三個或多個群組的平均數時,此方法可以告訴我們是否至少有一對平均數存在顯著差異,但無法告訴我們是哪一組平均數有差異。此外,各群組的應變數也必須為常態分佈,且各群組的群組內變異性必須相似。

單因子變異數分析用於檢定群組平均數的差異

單因子變異數分析是一種檢定虛無假設的統計方法 (H0),此虛無假設假設三個或以上的母體平均數相等,而替代假設 (Ha) 則是至少有一個平均數不相等。k 個平均數的統計假設形式符號寫法為:

$ H_0:\mu_1=\mu_2=\cdots=\mu_k $

$ H_a:\mathrm{not\mathrm{\ }all\ means\ are\ equal} $

而 μi是 第i 群組因子的平均數。

好,也許您正在想,在什麼情況下需要判斷多個母體的平均數是否相同或相異呢?常見的情況之一是,您會懷疑特定的獨立流程變數是導致該流程重要成果的原因。例如:您可能懷疑不同的生產批次、作業員或原物料批次如何影響製造流程的輸出成果 (也就是品質衡量結果)。

若要測試您的懷疑,可以執行使用三個或多個變數 (也就是層級) 執行獨立變數 (也就是因子) 的流程,然後從每次執行結果取樣。若您用單因子變異數分析比較各群組平均數時發現差異(假設其他環節都沒有出錯的話!),則代表您有證據佐證您的懷疑是正確的 -- 您調查的因子很可能對結果造成影響!

單因子變異數分析範例

讓我們一起深入探究單因子變異數分析範例。試想您為一家製造小罐裝黏著劑的公司工作。這種黏膠的黏稠度相當重要:太稠會不好塗抹;太稀則會黏性不足。最近有幾位不甚滿意的新客戶向您提出意見,表示黏著劑的黏稠度不如以往穩定。老闆要求您進行調查。

您決定最好先從檢驗最近五批產品的平均黏稠度開始。如果您在這幾批產品中發現差異,那很可能代表確實有發生問題。先假設有哪些因子可能造成批次間黏稠度不同,也許會有所幫助。

您將一個測量黏稠度的轉軸儀器浸泡至黏著劑罐子裡,用來測量黏著劑的黏稠度。此檢定為量測黏著劑的抗扭力。您檢定了從最近五批次產品中隨機取樣的五罐黏著劑。您收集到每一罐黏著劑的抗扭力資料,並將資料製作成圖表。

圖 1:各批次的抗扭力圖表

從資料圖表中,您觀察到批次 3 罐子的抗扭力相較於其他批次的抗扭力低。當您計算所有抗扭力資料的平均數時,您發現批次 3 的抗扭力為 26.77,遠低於其他四個批次-平均約為30。

表 1:從五個批次黏著劑檢定中得出的抗扭力平均數

批次編號
N
平均數
1
5
29.65
2
5
30.43
3
5
26.77
4
5
30.42
5
5
29.37

變異數分析表格

變異數分析結果通常會顯示在變異數分析表格中。變異數分析表格包含:

表 2:包含抗扭力檢定結果的變異數分析表格

來源
DF
差值平方和
均方
F 比例
機率 > F
批次
4
45.25
11.31
6.90
0.0012
誤差
20
32.80
1.64
總計
24
78.05

我們將於下方說明此表格中的各項元素如何產出。我們現在要將重點放在此表格中的一項關鍵元素:p 值。p 值用於評估認定所有平均數皆相同的虛無假設有效性。在我們的範例中,p 值 (機率 > F) 為 0.0012。因為此 p 值較小,所以可以作為平均數並非全部相等的證據。我們的樣本提供證據,證明在五個批次中的一個或多個批次之間,平均抗扭力值有所差異。

什麼是 p 值?

p 值用於測量假設檢定的可能性。假設檢定的目標,在於判斷是否有足夠的證據佐證特定的資料假設。讓我們回憶一下,使用變異數分析時,我們做出兩個假設:所有平均數都相等的 虛無假設 以及平均數不相等的 替代假設

因為我們只檢驗從全體母體擷取的隨機樣本,因此可能會面臨樣本平均數無法代表全體母體平均數的風險。p 值可幫助我們量化風險。p 值代表樣本資料平均數出現差異的可能性純屬機率,具體來說,p 值代表當虛無假設為真 (全體母體平均數實際上相等) 時,觀察到的樣本平均數變異值至少會跟您測量的結果一樣大的可能性。

p 值較小則否定虛無假設。否定虛無假設的臨界值為 0.05。也就是說,如果您的 p 值小於 0.05,就可以否定虛無假設,並選擇至少有一個平均數與其他不同的替代假設。

根據這些結果,您決定要保留批次 3 來做進一步檢定。您可能在報告中寫下:我們從最近五個批次測量五罐產品的抗扭力。從觀察中發現的變異數分析支持批次間平均抗扭力有差異 (p = 0.0012)。資料圖表顯示批次 3 比起其他批次,平均抗扭力較低 (26.77)。我們會保留批次 3 進行進一步的評估。

切記,變異數分析檢定無法告訴您哪一組或多組平均數與其他有差異,且 (和我們的範例不同),從資料圖表上也不一定能顯著看出差異。使用多重比較檢定是尋找特定群組間是否具有差異的方法之一。舉例來說,若要比較群組平均數與整體平均數,您可以使用平均數分析 (ANOM)。若要比較個別平均數配對,您可以使用 Tukey-Kramer 多重比較檢定。

單因子變異數分析計算

現在,讓我們來深入探索範例中討論的抗扭力檢定。讓我們回憶一下,我們一共有五批次的材料。每個批次我們都隨機選擇了五罐來進行檢定。這叫做單因子設計。這個單因子,也就是批次,有五個層級。各層級都會重複 (檢定) 五次。檢定結果如下。

表 3:各批次的抗扭力測量結果

批次 1
批次 2
批次 3
批次 4
批次 5
罐 1
29.39
30.63
27.16
31.03
29.67
罐 2
31.51
32.10
26.63
30.98
29.32
罐 3
30.88
30.11
25.31
28.95
26.87
罐 4
27.63
29.63
27.66
31.45
31.59
罐 5
28.85
29.68
27.10
29.70
29.41
平均數
29.65
30.43
26.77
30.42
29.37

為了探索上方變異數分析表 (表 2) 中的計算結果,讓我們首先建立以下定義:

$n_i$ = 處理 $i$ 的觀察數量 (如我們的範例,批次 $i$)

$N$ = 觀察總數

$Y_{ij}$ = ith 處理的 jth 觀察

$\overline{Y}_i$ = ith 處理的樣本平均數

$\overline{\overline{Y}}$ = 所有觀察的平均數 (總平均數)

差值平方和

瞭解這些定義後,讓我們一起來看看變異數分析表格中的差值平方和欄。差值平方和讓我們能夠聚焦於資料集中不同資料點的差異,以及所有資料點的平均數,進而量化資料的變異性。下方的公式將整體變異性分為兩個部分:因為模型或因子而產生的變異性,與因為隨機誤差而產生的變異性。

$$ \sum_{i=1}^{a}\sum_{j=1}^{n_i}(Y_{ij}-\overline{\overline{Y}})^2\;=\;\sum_{i=1}^{a}n_i(\overline{Y}_i-\overline{\overline{Y}})^2+\sum_{i=1}^{a}\sum_{j=1}^{n_i}(Y_{ij}-\overline{Y}_i)^2 $$

$$ SS(總計)\; = \;SS(因子)\; + \;SS(誤差) $$

雖然方程式可能很複雜,將重點放在個別元素會更容易掌握。下表 4 列出了公式的每個元素,並加以構成平方,以組成差值平方和。第一欄資料 ($Y_{ij}$) 包含我們於上表 3 收集的抗扭力測量資料。

另一種檢視變異性來源的方法:群組間變異數與群組內變異數

請回憶上述的變異數分析表 (表 2),來源欄列出了兩個變異數來源:因子 (在我們的範例中為批次) 與誤差。這兩種來源也可以視為 群組間變異數 (對應至因子或處理方式的變異數) 與 群組內變異數 (對應至機率或誤差的變異數)。此術語表示我們的差值平方和(SS)公式基本上為計算群組 差異 (處理方式效應) 與群組 差異 (因機率而產生之無法說明的差異),而衍生的變異數和。

表 4:差值平方和(SS)計算

批次
$Y_{ij} $
$\overline{Y}_i $
$\overline{\overline{Y}}$
$\overline{Y}_i-\overline{\overline{Y}}$
$Y_{ij}-\overline{\overline{Y}}$
$Y_{ij}-\overline{Y}_i $
$(\overline{Y}_i-\overline{\overline{Y}})^2 $
$(Y_{ij}-\overline{Y}_i)^2 $
$(Y_{ij}-\overline{\overline{Y}})^2 $
1
29.39
29.65
29.33
0.32
0.06
-0.26
0.10
0.07
0.00
1
31.51
29.65
29.33
0.32
2.18
1.86
0.10
3.46
4.75
1
30.88
29.65
29.33
0.32
1.55
1.23
0.10
1.51
2.40
1
27.63
29.65
29.33
0.32
-1.70
-2.02
0.10
4.08
2.89
1
28.85
29.65
29.33
0.32
-0.48
-0.80
0.10
0.64
0.23
2
30.63
30.43
29.33
1.10
1.30
0.20
1.21
0.04
1.69
2
32.10
30.43
29.33
1.10
2.77
1.67
1.21
2.79
7.68
2
30.11
30.43
29.33
1.10
0.78
-0.32
1.21
0.10
0.61
2
29.63
30.43
29.33
1.10
0.30
-0.80
1.21
0.64
0.09
2
29.68
30.43
29.33
1.10
0.35
-0.75
1.21
0.56
0.12
3
27.16
26.77
29.33
-2.56
-2.17
0.39
6.55
0.15
4.71
3
26.63
26.77
29.33
-2.56
-2.70
-0.14
6.55
0.02
7.29
3
25.31
26.77
29.33
-2.56
-4.02
-1.46
6.55
2.14
16.16
3
27.66
26.77
29.33
-2.56
-1.67
0.89
6.55
0.79
2.79
3
27.10
26.77
29.33
-2.56
-2.23
0.33
6.55
0.11
4.97
4
31.03
30.42
29.33
1.09
1.70
0.61
1.19
0.37
2.89
4
30.98
30.42
29.33
1.09
1.65
0.56
1.19
0.31
2.72
4
28.95
30.42
29.33
1.09
-0.38
-1.47
1.19
2.16
0.14
4
31.45
30.42
29.33
1.09
2.12
1.03
1.19
1.06
4.49
4
29.70
30.42
29.33
1.09
0.37
-0.72
1.19
0.52
0.14
5
29.67
29.37
29.33
0.04
0.34
0.30
0.00
0.09
0.12
5
29.32
29.37
29.33
0.04
-0.01
-0.05
0.00
0.00
0.00
5
26.87
29.37
29.33
0.04
-2.46
-2.50
0.00
6.26
6.05
5
31.59
29.37
29.33
0.04
2.26
2.22
0.00
4.93
5.11
5
29.41
29.37
29.33
0.04
0.08
0.04
0.00
0.00
0.01
差值平方和
SS (因子) = 45.25
SS (誤差) = 32.80
SS (總計) = 78.05

自由度 (DF)

與各差值平方相關的數量為自由度 (DF)。自由度為用於計算各差值平方的獨立資訊數量。使用 k 級 (在我們的範例中為五個批次) 因子進行單因子設計,且觀察總數為 N (每批次 5 罐,總計 25 罐),自由度如下:

表 5:判斷自由度

自由度 (DF) 公式
計算自由度
SS (因子)
k - 1
5 - 1 = 4
SS (誤差)
N - k
25 - 5 = 20
SS (總計)
N - 1
25 - 1 = 24

均方 (MS) 與 F 比例

我們將各差值平方除以對應的自由度以取得均方。當虛無假設為真 (即平均數相等) 時,MS (因子) 與 MS (誤差) 都是誤差變異的預估值,且大小應該大致相同。其比例或 F 比例應接近 1。若虛無假設並非為真,那麼 MS (因子) 將大於 MS (誤差),且其比例將大於 1。以我們的黏著劑檢定為例,計算出的 F 比例為 6.90,明顯指出平均數相等的虛無假設不正確。

表 6:計算均方與 F 比例

差值平方和 (SS)
自由度 (DF)
均方
F 比例
SS (因子)
45.25
4
45.25/4 = 11.31
11.31/1.64= 6.90
SS (誤差)
32.80
20
32.80/20 = 1.64

MS (因子) 對 MS (誤差) 的比例,也就是 F 比例,具有 F 分佈。F 分佈是當虛無假設 (也就是平均數相等) 為真時,我們預期觀察到的 F 值分佈。F 分佈的形狀會因兩個參數而異,這兩個參數分別為自由度的分母與分子。在變異數分析檢定中,分母為 MS (因子),因此自由度與 MS (因子) 相關。分子為 MS (誤差),所以自由度分子與 MS (誤差) 相關。

如果您計算出的 F 比例超過對應 F 分佈的預期值,假設 p 值足夠小,您可以否定平均數相等的虛無假設。在此情況下,p 值即為當虛無假設為真時,觀察到的 F 比例會比 F 分佈值更大的機率。

表 2:F 分佈