실험계획법(DOE)

실험 설계란 무엇인가요?

실험 설계(DOE)는 과학자와 엔지니어가 다양한 입력(예: 속도, 온도 또는 공급 업체)이 공정과 그 공정의 출력(예: 수율, 불순물 또는 비용)에 미치는 효과를 연구하기 위해 사용하는 체계적인 접근 방식입니다. DOE는 복잡한 시스템을 이해하고, 신뢰할 수 있는 데이터 기반 방식으로 결정을 내리는 강력하고 효율적인 프레임워크입니다.

DOE를 언제 사용해야 하나요?

대체로, 설계된 실험은 다음을 수행하고자 하는 경우에 도움이 될 수 있습니다.

  • 특정 요인 또는 요인 그룹이 관심 있는 반응에 영향을 미치는지 확인합니다.
  • 요인 및 반응 간의 잠재적 관계를 이해합니다.
  • 원하는 결과(예: 최대 수율)를 생성하는 요인 설정(예: 특정 온도 및 공급 업체)을 식별하여 하나 이상의 반응을 최적화합니다.

한 번에 한 가지 요인을 바꾸면 안 되나요?

한 번에 하나의 요인만 변경하는 것이 더 직관적이거나 간단해 보일 수 있겠지만, DOE 사용의 강점을 보여 드리기 위해 간단한 예제를 살펴보겠습니다.

한 번에 1요인 변경(OFAT) 접근법에서는 기타 모든 항목을 상수 수준으로 유지하면서 특정 요인의 설정 또는 수준을 변경하여 단일 요인을 검정합니다. 그런 다음 실험의 각 요인에 대해 이 과정을 반복합니다.

OFAT 예제

예를 들어, 화학 공정의 수율을 최대화하는 데 관심이 있고 온도pH수율을 결정하는 주요 요인이라는 것을 알고 있다고 가정해 보겠습니다. 현재 요인의 설정(온도 = 25°C 및 pH = 5.5)에서 수율은 83%입니다.

온도 = 25°C 및 pH = 5.5 설정에서 83%의 수율을 보여 주는 그래프

수율을 늘릴 수 있는지 확인하기 위해 pH를 현재 설정으로 유지하고 온도를 변화시키기로 결정합니다. 이전 경험을 통해 온도가 15°C 미만이거나 45°C를 초과하면 공정이 제대로 실행되지 않는다는 것을 알고 있으므로, 해당 범위 내에서 온도를 5°C씩 증분하여 변경하고 결과를 기록하기로 합니다.

pH를 5.5로 고정하고 온도를 5°C씩 증가시킨 수율 백분율 그래프

pH를 5.5로 일정하게 유지하면 온도를 30°C로 설정할 때 최대 수율이 85%에 도달하며, 이는 현재 설정에서 약간 개선된 수치입니다.

다음으로, 온도를 30°C로 고정하고 pH를 변화시키기로 결정합니다. 과거 경험을 바탕으로 pH를 5에서 8까지 0.5씩 변화시키고 결과를 기록하기로 합니다.

온도를 30°C로 고정하고 pH를 0.5씩 증가시킨 수율 백분율 그래프

이 13개의 검정 결과에서 한 번에 하나의 요인을 변경한 결과, 온도가 30°C로 설정되고 pH가 6일 때 수율이 86%로 최대화된다는 결과를 얻습니다. 또한 수율은 해당 값을 초과하거나 미달할 경우 감소하는 것으로 보입니다. 다시 말해, 각 요인과 반응 사이의 관계에 곡률이 있는 것으로 보입니다.

OFAT 검정을 기반으로 각 요인과 반응 간의 관계를 보여 주는 3차원 그래프

하지만 이 OFAT 실험이 온도, pH, 및 수율 사이의 진정한 관계를 포착했다고 확신할 수 있을까요? 온도pH를 체계적으로 함께 변화시키지 않았기 때문에 이러한 요인 간의 교호작용 가능성을 조사할 수 없습니다. 즉, 온도수율에 미치는 영향이 pH 수준에 따라 달라지는지, 또는 그 반대인지 알 수 없습니다. 실제로 교호작용이 있는 경우, 반응의 형태인 수율은 OFAT 실험 후에 내린 결론과 매우 다르게 보일 수 있습니다.

이 두 요인이 서로 상호 작용하는지 평가하고, 요인의 범위(실험 영역)에서 반응이 실제로 어떻게 나타나는지 이해하기 위해 어떤 종류의 실험을 해야 할까요? 온도pH의 모든 가능한 조합을 각각 범위에 걸쳐 검정할 수 있지만, 그렇게 하면 시간과 비용이 많이 듭니다. 이 예제에서 요인을 동일한 증분량만큼 변화시킨다고 가정하면 전체 실험 영역을 포괄하기 위해 49개의 검정을 수행해야 합니다.

OFAT 접근 방식을 사용하여 가능한 모든 요인 설정 조합을 처리하는 데 필요한 49개의 검정을 보여 주는 그래프

DOE는 온도pH수율에 미치는 영향과 이들이 교호작용하는지를 알아내는 데 더 나은 방법을 제공합니다.  한번 살펴보겠습니다.

설계된 실험 사용

이 2요인 예제에서는 실험 영역을 정사각형의 모서리로 정의합니다. 즉, 두 요인이 모두 낮은 수준에 있는 경우, 두 요인이 모두 높은 수준에 있는 경우, 그리고 한 요인이 낮고 다른 요인이 높은 조합의 경우입니다.

사각형의 모서리로 정의된 실험 영역을 보여 주는 그래프

이러한 처리 조합을 검정하면 각 요인이 수율에 미치는 개별적인 효과와 그 사이의 가능한 교호작용을 추정할 수 있습니다. 요인을 중간 수준으로 설정한 검정을 추가하면 반응 형태의 곡률을 추정할 수 있습니다.

극단(코너) 및 중간 수준의 요인 설정을 포함하는 그래프

총 아홉 가지의 처리 조합이 있습니다. 가능한 경우 최소 하나의 처리 조합을 반복 실험하면 모형의 용어에 대한 통계적 유의성을 검정할 수 있습니다. 이 예제에서 실험은 12회의 검정, 즉 9개의 처리 조합과 3회의 반복 실험 실행으로 구성됩니다. 실험 결과가 실험 외부의 변동 요인에 영향을 받지 않도록 하기 위해, 실행을 무작위 순서로 수행하고 결과를 기록합니다.

무작위 순서로 12번의 실행과 그에 따른 결과를 기록한 테이블

이 실험의 결과는 온도가 45°C이고 pH가 8일 때 최대 수율(91%)이 발생하며, 이는 OFAT 실험의 최적 결과(최대 수율이 86%)보다 개선된 수치입니다. 실험 영역 내에서 온도pH의 검정되지 않은 설정 조합이 있어서 수율을 더 높일 수 있는 가능성이 있을까요? 추가 실험을 수행하지 않고 그 질문에 어떻게 답할 수 있을까요?

데이터를 분석할 때, 온도, pH, 수율 간의 관계를 설명하는 통계 모형을 구축합니다. 이는 보간모형으로, 실험 영역 내에서 검정되지 않은 요인 조합에 대해서도 예측을 수행할 수 있습니다. 모형은 온도pH의 개별 효과, 두 요인 간의 교호작용, 그리고 2차 효과를 포함하며, 여기서 β는 추정 계수입니다.

$$ 예측값\:수율 = \beta_0 + \beta_1 온도 + \beta_2 pH + \beta_{12} 온도 * pH + \beta_{11} 온도^2 + \beta_{22} pH^2 $$

이 반응 시각화에서 형태는 OFAT FAT 데이터에 표시된 것과 다릅니다. 실험 영역의 중심에서 감소하는 대신, 온도pH가 증가함에 따라 표면이 상승하고 왜곡되는 것을 볼 수 있습니다. 이러한 왜곡은 두 요인 군간 교호작용을 시사합니다. 이는 OFAT 실험에서 감지되지 않았던 것이며, 감지할 수 없었던 것입니다.

DOE 검정 방법을 기반으로 각 요인과 반응 간의 관계를 보여 주는 3차원 그래프

그런 다음 이 모형을 사용하여 미래수율 값을 예측할 수 있으며, 특히 실험 영역 군내에서 수율을 최대화할 것으로 예측되는 온도pH 설정을 찾을 수 있습니다. 이 예제에서 모형은 온도를 45°C, pH를 7로 설정했을 때 수율이 92%로 최대화될 것이라고 예측합니다. 이 조합은 직접 검증하지 않은 것입니다.

DOE 모형으로 예측된 최적의 설정을 강조 표시하는 그래프

물론, 최대 수율을 예측하는 요인 설정에서 몇 가지 추가 검정을 실행하여 이 예측을 확인하고 싶을 것입니다!

요약

이 예제에서, 현재 공정 설정을 시작으로 한 OFAT 실험은 수율 최대화를 위한 최선의 설정을 찾지 못했으며, 온도pH 사이의 교호작용이 있는지를 평가하는 데 필요한 데이터를 제공하지 못했습니다. 사실, OFAT 방법은 시스템이 실제로 어떻게 작동하는지를 놓친 것이 분명합니다.

OFAT 방법으로 해당 설정을 찾는 유일한 방법은 실험 영역 내에서 가능한 모든 처리 조합을 검정하는 것이었습니다. 이 시나리오에서는 49개의 개별 검정이 필요하며, 요인은 단 두 가지뿐입니다. 5개, 10개 또는 그 이상의 요인이 있는 보다 현실적인 상황에서 이 접근 방식을 적용하려면 얼마나 많은 검정이 필요할지 상상해 보세요!

위의 예제에서 설계된 실험은 온도pH 사이의 가능한 교호작용을 포함하는 모형을 적합할 수 있게 하여 모든 가능한 요인 조합을 검정하지 않고도 실험 영역 전체에서 예측할 수 있도록 해 주었습니다. 이렇게 하여 모든 조합을 검정해야 할 때보다 훨씬 적은 실행 횟수(12회 대 49회, 즉 약 25%)로 최선의 설정을 찾을 수 있었습니다. 이는 요인 수가 매우 제한된 간단한 예제였습니다. DOE를 사용할 때의 이점은 요인이 많을수록 증가합니다.