이 섹션에서는 확증적 선별 적합 플랫폼에 사용되는 알고리즘의 요약 정보를 제공합니다. 자세한 내용은 Jones and Nachtsheim(2016)에서 확인하십시오.
유효 모형 선택 알고리즘은 반응 Y를 YME와 Y2nd라는 두 가지 반응으로 표현하여 Y = YME + Y2nd가 되도록 합니다.
– YME는 주효과 및 가짜 요인에 대한 Y 회귀에서 구한 예측값입니다.
설계의 접기 구조 때문에 YME에 블록 요인을 포함할 필요가 없습니다. 블록 요인은 Y2nd에 포함됩니다.
– Y2nd는 Y2nd = Y - YME로 지정됩니다.
참고: DSD에서 YME 열과 Y2nd 열은 직교입니다.
분석은 다음 두 단계로 진행됩니다.
• 1단계: 반응 YME를 사용하여 주효과를 식별합니다. 1단계에서는 활성으로 간주되는 주효과를 식별합니다.
• 2단계: 반응 Y2nd를 사용하여 2차 효과(second-order effect)를 식별합니다. 2단계에서는 1단계의 활성 주효과에 있는 모든 2차 항을 고려하고 이러한 포함 효과 중에서 활성으로 간주되는 부분집합을 결정합니다.
참고: 블록 요인이 있으면 유의하지 않더라도 2단계의 효과 목록에 포함됩니다.
1단계 방법론은 설계에 가짜 요인 또는 중앙점 반복 실험이 포함되는지 여부에 따라 달라집니다.
1. 가짜 요인 또는 중앙점 반복 실험을 사용하면 모형과 독립적인 오차 분산 추정량이 생성됩니다. 3차 이상의 홀수 차수 활성 효과가 없다고 가정할 경우 이 추정값은 비편향입니다.
2. YME를 사용하여 주효과를 이 추정값과 대조하여 검정합니다. p 값이 p 값 임계보다 작은 주효과가 활성으로 간주됩니다. 임계값은 다음과 같습니다.
– 오차 자유도가 1인 경우 임계값은 0.20입니다.
– 오차 자유도가 2인 경우 임계값은 0.10입니다.
– 오차 자유도가 3 이상인 경우 임계값은 0.05입니다.
– 사용자 지정 p 값이 임계값입니다.
참고: 다른 p 값 임계를 지정하려면 "확증적 선별 적합"의 빨간색 삼각형 메뉴에서 1단계 p 값 설정을 선택하십시오.
3. p 값이 임계값보다 작은 주효과가 없으면 p 값이 가장 작은 3개의 주효과로 계속합니다. 설계에 포함된 요인이 3개 미만이면 모든 주효과가 포함됩니다.
4. 활성 주효과가 발견되면 비활성 주효과의 변동이 (1)에서 생성된 오차 분산과 통합됩니다.
참고: 범주형 요인이 설계에 있는 경우 주효과가 활성으로 선택될 때마다 추정 계수가 다시 계산됩니다.
이 경우에는 모형에 독립적인 오차 분산 추정량이 제공되지 않습니다. 비활성 주효과에서 생성된 오차 분산 추정값과 대조하여 주효과 부분집합을 순차적으로 검정합니다. m개의 주효과가 있다고 가정해 보겠습니다.
1. YME를 반응으로 사용한 추정 효과의 절대값이 내림차순으로 정렬됩니다.
2. 각 1 £ i < m에 대해, 절대값이 i번째로 큰 효과를 해당 효과 및 절대값이 더 큰 모든 효과가 포함된 모형의 조정된 잔차 제곱합과 대조하여 검정합니다.
3. 모형에서 p 값이 가장 작은 효과가 활성 효과로 간주됩니다.
4. 활성 주효과가 발견되면 비활성 주효과의 변동을 사용하여 YME를 반응으로 사용한 오차 분산의 추정값을 생성합니다.
참고: 사례 2에서 확증적 선별 적합 절차가 제대로 작동하려면 주효과 중 하나 이상이 활성이어야 하고 하나 이상이 비활성이어야 합니다. 활성 주효과가 없거나 모든 주효과가 활성이면 절차에서 주효과 집합이 식별되지만 해당 부분집합을 얻기 위한 절차의 정확성이 떨어집니다.
2단계에서 고려되는 요인은 강 유전성 옵션에 따라 달라집니다. 강 유전성이 선택되면 1단계에서 주효과가 활성으로 식별된 요인과 관련된 2차 효과(second-order effect)만 고려됩니다. 2단계 방법론은 1단계에서 식별된 활성 주효과의 수에 따라 달라집니다.
2단계에서는 단계별 부분집합 선택 절차를 사용합니다. 목표는 1단계의 RMSE에 대한 2단계의 RMSE 비율이 지정된 임계값보다 큰 경우 계속해서 모형에 2차 효과(second-order effect)를 추가하는 것입니다. 비율이 임계값보다 작거나 같으면 모형에 추가할 2차 효과(second-order effect)가 더 없음을 나타냅니다. 기본 임계값은 1입니다. 임계값이 작을수록 더 큰 임계값에 비해 활성으로 식별될 수 있는 항 수가 증가합니다.
참고: RMSE 비율 임계값을 1이 아닌 다른 값으로 지정하려면 "확증적 선별 적합"의 빨간색 삼각형 메뉴에서 2단계 비율 설정을 선택합니다.
2단계에서
• 오차 자유도가 1인 경우 임계값은 0.20입니다.
• 오차 자유도가 2인 경우 임계값은 0.10입니다.
• 오차 자유도가 3 이상인 경우 임계값은 0.05입니다.
• 사용자 지정 p 값이 임계값입니다.
1. Y2nd의 변동을 1단계의 오차 추정값과 대조하여 검정한 후 2차 효과(second-order effect)로 인한 추가 변동이 있는지 여부를 판별합니다.
– 이 검정의 p 값이 임계값을 초과하면 절차가 종료되고 활성 2차 효과(second-order effect)가 식별되지 않습니다.
2. 이 검정의 p 값이 임계값보다 작거나 같으면 k 크기(k = 1,2,3,...)의 부분집합이 k = 1부터 시작하여 계속 검정됩니다.
3. 각 k에 대해 해당 크기의 각 부분집합에 대한 잔차 제곱합을 1단계의 오차 추정값과 대조하여 검정합니다. RMSE가 가장 작은 부분집합이 식별됩니다.
4. 1단계 RMSE에 대한 RMSE의 비율이 2단계 비율보다 작은 k가 발견될 때까지 절차가 계속됩니다.
5. 최종값 k에 해당하는 앞선 부분집합의 효과는 활성 2요인 효과로 간주됩니다.
1단계에서 활성 주효과가 8개 이상 식별된 경우 2단계에서는 2차 항에 대해 전진 선택을 사용합니다.
참고: 모형에 포함되는 2차 항 개수는 설계 크기에 따라 제한됩니다. 일반적으로 2차 항 개수는 런 수를 4로 나눈 값(내림)입니다.