실험계획법(DOE)
실험 설계란 무엇인가요?
실험 설계(DOE)는 과학자와 엔지니어가 다양한 입력(예: 속도, 온도 또는 공급 업체)이 공정과 그 공정의 출력(예: 수율, 불순물 또는 비용)에 미치는 효과를 연구하기 위해 사용하는 체계적인 접근 방식입니다. DOE는 복잡한 시스템을 이해하고, 신뢰할 수 있는 데이터 기반 방식으로 결정을 내리는 강력하고 효율적인 프레임워크입니다.
DOE를 언제 사용해야 하나요?
대체로, 설계된 실험은 다음을 수행하고자 하는 경우에 도움이 될 수 있습니다.
- 특정 요인 또는 요인 그룹이 관심 있는 반응에 영향을 미치는지 확인합니다.
- 요인 및 반응 간의 잠재적 관계를 이해합니다.
- 원하는 결과(예: 최대 수율)를 생성하는 요인 설정(예: 특정 온도 및 공급 업체)을 식별하여 하나 이상의 반응을 최적화합니다.
한 번에 한 가지 요인을 바꾸면 안 되나요?
한 번에 하나의 요인만 변경하는 것이 더 직관적이거나 간단해 보일 수 있겠지만, DOE 사용의 강점을 보여 드리기 위해 간단한 예제를 살펴보겠습니다.
한 번에 1요인 변경(OFAT) 접근법에서는 기타 모든 항목을 상수 수준으로 유지하면서 특정 요인의 설정 또는 수준을 변경하여 단일 요인을 검정합니다. 그런 다음 실험의 각 요인에 대해 이 과정을 반복합니다.
OFAT 예제
예를 들어, 화학 공정의 수율을 최대화하는 데 관심이 있고 온도 및 pH가 수율을 결정하는 주요 요인이라는 것을 알고 있다고 가정해 보겠습니다. 현재 요인의 설정(온도 = 25°C 및 pH = 5.5)에서 수율은 83%입니다.
수율을 늘릴 수 있는지 확인하기 위해 pH를 현재 설정으로 유지하고 온도를 변화시키기로 결정합니다. 이전 경험을 통해 온도가 15°C 미만이거나 45°C를 초과하면 공정이 제대로 실행되지 않는다는 것을 알고 있으므로, 해당 범위 내에서 온도를 5°C씩 증분하여 변경하고 결과를 기록하기로 합니다.
pH를 5.5로 일정하게 유지하면 온도를 30°C로 설정할 때 최대 수율이 85%에 도달하며, 이는 현재 설정에서 약간 개선된 수치입니다.
다음으로, 온도를 30°C로 고정하고 pH를 변화시키기로 결정합니다. 과거 경험을 바탕으로 pH를 5에서 8까지 0.5씩 변화시키고 결과를 기록하기로 합니다.
이 13개의 검정 결과에서 한 번에 하나의 요인을 변경한 결과, 온도가 30°C로 설정되고 pH가 6일 때 수율이 86%로 최대화된다는 결과를 얻습니다. 또한 수율은 해당 값을 초과하거나 미달할 경우 감소하는 것으로 보입니다. 다시 말해, 각 요인과 반응 사이의 관계에 곡률이 있는 것으로 보입니다.
하지만 이 OFAT 실험이 온도, pH, 및 수율 사이의 진정한 관계를 포착했다고 확신할 수 있을까요? 온도와 pH를 체계적으로 함께 변화시키지 않았기 때문에 이러한 요인 간의 교호작용 가능성을 조사할 수 없습니다. 즉, 온도가 수율에 미치는 영향이 pH 수준에 따라 달라지는지, 또는 그 반대인지 알 수 없습니다. 실제로 교호작용이 있는 경우, 반응의 형태인 수율은 OFAT 실험 후에 내린 결론과 매우 다르게 보일 수 있습니다.
이 두 요인이 서로 상호 작용하는지 평가하고, 요인의 범위(실험 영역)에서 반응이 실제로 어떻게 나타나는지 이해하기 위해 어떤 종류의 실험을 해야 할까요? 온도와 pH의 모든 가능한 조합을 각각 범위에 걸쳐 검정할 수 있지만, 그렇게 하면 시간과 비용이 많이 듭니다. 이 예제에서 요인을 동일한 증분량만큼 변화시킨다고 가정하면 전체 실험 영역을 포괄하기 위해 49개의 검정을 수행해야 합니다.
DOE는 온도 및 pH가 수율에 미치는 영향과 이들이 교호작용하는지를 알아내는 데 더 나은 방법을 제공합니다. 한번 살펴보겠습니다.
설계된 실험 사용
이 2요인 예제에서는 실험 영역을 정사각형의 모서리로 정의합니다. 즉, 두 요인이 모두 낮은 수준에 있는 경우, 두 요인이 모두 높은 수준에 있는 경우, 그리고 한 요인이 낮고 다른 요인이 높은 조합의 경우입니다.
이러한 처리 조합을 검정하면 각 요인이 수율에 미치는 개별적인 효과와 그 사이의 가능한 교호작용을 추정할 수 있습니다. 요인을 중간 수준으로 설정한 검정을 추가하면 반응 형태의 곡률을 추정할 수 있습니다.
총 아홉 가지의 처리 조합이 있습니다. 가능한 경우 최소 하나의 처리 조합을 반복 실험하면 모형의 용어에 대한 통계적 유의성을 검정할 수 있습니다. 이 예제에서 실험은 12회의 검정, 즉 9개의 처리 조합과 3회의 반복 실험 실행으로 구성됩니다. 실험 결과가 실험 외부의 변동 요인에 영향을 받지 않도록 하기 위해, 실행을 무작위 순서로 수행하고 결과를 기록합니다.
이 실험의 결과는 온도가 45°C이고 pH가 8일 때 최대 수율(91%)이 발생하며, 이는 OFAT 실험의 최적 결과(최대 수율이 86%)보다 개선된 수치입니다. 실험 영역 내에서 온도 및 pH의 검정되지 않은 설정 조합이 있어서 수율을 더 높일 수 있는 가능성이 있을까요? 추가 실험을 수행하지 않고 그 질문에 어떻게 답할 수 있을까요?
데이터를 분석할 때, 온도, pH, 수율 간의 관계를 설명하는 통계 모형을 구축합니다. 이는 보간모형으로, 실험 영역 내에서 검정되지 않은 요인 조합에 대해서도 예측을 수행할 수 있습니다. 모형은 온도 및 pH의 개별 효과, 두 요인 간의 교호작용, 그리고 2차 효과를 포함하며, 여기서 β는 추정 계수입니다.
$$ 예측값\:수율 = \beta_0 + \beta_1 온도 + \beta_2 pH + \beta_{12} 온도 * pH + \beta_{11} 온도^2 + \beta_{22} pH^2 $$
이 반응 시각화에서 형태는 OFAT FAT 데이터에 표시된 것과 다릅니다. 실험 영역의 중심에서 감소하는 대신, 온도 및 pH가 증가함에 따라 표면이 상승하고 왜곡되는 것을 볼 수 있습니다. 이러한 왜곡은 두 요인 군간 교호작용을 시사합니다. 이는 OFAT 실험에서 감지되지 않았던 것이며, 감지할 수 없었던 것입니다.
그런 다음 이 모형을 사용하여 미래의 수율 값을 예측할 수 있으며, 특히 실험 영역 군내에서 수율을 최대화할 것으로 예측되는 온도 및 pH 설정을 찾을 수 있습니다. 이 예제에서 모형은 온도를 45°C, pH를 7로 설정했을 때 수율이 92%로 최대화될 것이라고 예측합니다. 이 조합은 직접 검증하지 않은 것입니다.
물론, 최대 수율을 예측하는 요인 설정에서 몇 가지 추가 검정을 실행하여 이 예측을 확인하고 싶을 것입니다!
요약
이 예제에서, 현재 공정 설정을 시작으로 한 OFAT 실험은 수율 최대화를 위한 최선의 설정을 찾지 못했으며, 온도와 pH 사이의 교호작용이 있는지를 평가하는 데 필요한 데이터를 제공하지 못했습니다. 사실, OFAT 방법은 시스템이 실제로 어떻게 작동하는지를 놓친 것이 분명합니다.
OFAT 방법으로 해당 설정을 찾는 유일한 방법은 실험 영역 내에서 가능한 모든 처리 조합을 검정하는 것이었습니다. 이 시나리오에서는 49개의 개별 검정이 필요하며, 요인은 단 두 가지뿐입니다. 5개, 10개 또는 그 이상의 요인이 있는 보다 현실적인 상황에서 이 접근 방식을 적용하려면 얼마나 많은 검정이 필요할지 상상해 보세요!
위의 예제에서 설계된 실험은 온도와 pH 사이의 가능한 교호작용을 포함하는 모형을 적합할 수 있게 하여 모든 가능한 요인 조합을 검정하지 않고도 실험 영역 전체에서 예측할 수 있도록 해 주었습니다. 이렇게 하여 모든 조합을 검정해야 할 때보다 훨씬 적은 실행 횟수(12회 대 49회, 즉 약 25%)로 최선의 설정을 찾을 수 있었습니다. 이는 요인 수가 매우 제한된 간단한 예제였습니다. DOE를 사용할 때의 이점은 요인이 많을수록 증가합니다.