實驗設計(Design of Experiments)

什麼是實驗設計?

實驗設計(簡稱DOE)是科學家和工程師常用的一種系統化方法,主要目的是用來研究不同輸入因子(例如:速度、溫度或供應商等因素)對於某個製程及其輸出結果(例如:良率、雜質含量或生產成本)所造成的影響。DOE 是一種強大且高效的框架,可用來深入理解複雜系統,並以可靠且數據驅動的思維做出決策。

什麼時候該使用 DOE?

廣義來說,一個有效的設計實驗可以助力於:

  • 判斷某個因子或多個因子是否會影響你所關注的反應變數。
  • 了解因子與反應變數之間可能存在的相關性。

透過最佳化一項或多項反應變數(例如特定溫度與供應商),找出最佳因子設定,以達到產生最佳產出的目的。

為什麼不一次只改變一個因子?

一次只改變一個因子的實驗方法(稱為「單因子實驗設計」,One-Factor-At-a-Time, OFAT)乍看之下更直覺好懂。不過,以下這個簡單的例子可以說明 DOE 的強大之處。

在單因子實驗設計方法中,你會一次只選擇一個因子進行調整,並控制其他因子不變。接著,依序對每一個因子重複相同的操作。

一次一因子的範例

假設你希望某化學製程的 良率最大化,並已知 溫度pH 值 是影響良率的主要因素。目前的製程設定為:溫度 25°C,pH 為 5.5,良率為 83%。

Graph showing Yield of 83% for settings of Temperature = 25°C and pH = 5.5

你決定先將 pH 值固定在 5.5,然後改變溫度。根據過往經驗,若溫度低於 15°C 或高於 45°C,製程表現不佳。因此,你將溫度設定在 15°C 到 45°C 間,每隔 5°C 測試一次,並記錄良率。

Graph of Yield percentages with pH fixed at 5.5 and Temperature increasing in increments of 5

當 pH 固定在 5.5 時,你發現溫度設在 30°C 時,良率最高為 85%,比原本稍有改善。

接著,你將溫度固定在 30°C,並將 pH 值由 5 調整至 8,每次變動 0.5,並記錄結果。

Graph of Yield percentages with Temperature fixed at 30 and pH increasing in increments of 0.5

經過這 13 次實驗後(每次只改變一個因子),你得出結論:當溫度為 30°C 且 pH 為 6 時,良率最高為 86%。而且產值在這些值以外的情況下會下降,也就是說反應變數與因子之間的關係呈現「彎曲性」。

Three-dimensional graph showing the relationship between each factor and the response based on OFAT testing

但你能確保這樣的實驗真的準確嗎?

OFAT 實驗並未系統性地同時調整溫度與 pH,因此你無法確定兩者之間是否存在交互作用(Interaction)。也就是說,你無法判斷溫度對產率的影響是否會依據 pH 的不同而改變,反之亦然。如果兩者之間確實有交互作用,那麼反應變數的行為模式(例如產率的變化)將與你在 OFAT 實驗中觀察到的結果完全不同。

若你想探討兩個因子是否存在交互作用,並了解在整個測試範圍內(即「實驗區域」)反應變數的真實行為,你就必須測試所有可能的因子組合。但這樣會非常耗時又昂貴。在這個例子中,如果以相同的間距變動因子,將需要進行 49 次實驗來涵蓋整個實驗區域。

Graph showing the 49 tests required to address every possible combination of factor settings using the OFAT approach

DOE提供了一個更好去了解溫度和pH值兩個因子如何交互影響良率的方法,一起來看看。

使用JMP實驗設計

在這個兩因子的例子中,實驗區域可定義為一個方形的四個角落:兩個因子皆為低水準、兩個皆為高水準,以及一高一低的組合。

Graph showing the experimental region defined by the corners of a square

測試這些實驗組合可估算各因子對良率的個別影響,以及兩者的交互作用。再加上一些位於中間水準的設定,可進一步估計反應變數的曲度。

Graph including factor settings at extremes (corners) and middle levels

整體來說,這樣的實驗設計包含九種組合。若能重複其中一個或數個組合,有助於檢驗模型中參數的統計顯著性。在這個案例中,共進行了 12 次實驗(9 種組合 + 3 次重複測試)。為避免外部變異影響結果,所有實驗以隨機順序執行並記錄資料。

Table recording 12 runs in random order and corresponding results

實驗結果顯示,當溫度為 45°C 且 pH 為 8 時,良率最高達到 91%,比 OFAT 方法的最佳結果(86%)還高。那麼是否可能存在一組未測試過的設定能讓良率更高?該如何在不額外增加實驗的情況下回答這個問題?

當我們正在分析實驗數據時,可以建立一個用以描述溫度、pH 與良率關係的統計模型。這是一種「內插模型」(interpolating model),可預測在未測試組合下的良率。該模型包含溫度與 pH 的主效應、交互作用項,以及二次效應項,其形式如下:

$$ Predicted\:Yield = \beta_0 + \beta_1 Temp + \beta_2 pH + \beta_{12} Temp * pH + \beta_{11} Temp^2 + \beta_{22} pH^2 $$

透過此模型建立的圖可看出,良率的變化不像 OFAT 所呈現的單純下降。相反地,隨著溫度與 pH 增加,曲面上升並扭曲,顯示兩個因子間存在交互作用——這是在 OFAT 中無法觀察到的。

Three-dimensional graph showing the relationship between each factor and the response based on DOE testing methods

你也可以利用這個模型來預測未來的良率,特別是找出能最大化良率的溫度與 pH 設定組合。例如,此模型預測:當溫度為 45°C、pH 為 7 時,產率可達到 92%。這是一組你在實驗中未實際測試過的設定。

Graph highlighting the optimum settings predicted by the DOE model

你當然多做幾次實驗,來驗證並確認模型的預測準確性。

總結

在這個案例中,從現有製程條件出發的 OFAT 實驗,不僅無法找出能讓良率最大化的最佳設定,也未能提供足夠的數據來評估溫度與 pH 是否存在交互作用。事實上,OFAT 無法展現系統的真正作用過程。

若使用 OFAT 方法想找出最佳設定,必須測試所有可能的處理組合。光是兩個因子,就需要 49 次實驗。若因子增加到五個、十個甚至更多,所需實驗次數將急劇增加。

另一方面,透過DOE 設計出來的實驗只需進行 12 次,就能建立能預測整個實驗區域結果的模型(約為 OFAT 所需次數的 25%),並包含交互作用與曲面的探討。這個案例雖然簡單,但當因子數量越多,DOE 的優勢就越明顯。

想要瞭解更多DOE的案例,歡迎觀看隨選研討會:

DOE經典案例實戰:產品研發與製程優化的3種實驗設計方法