고급 컨트롤"일반화 회귀" 제어판에서 "고급 컨트롤" 옵션을 사용하여 모형 적합 프로세스의 다양한 요소를 조정할 수 있습니다. 여러 컨트롤이 조정 모수의 격자와 관련이 있습니다.
Lasso 회귀 및 능형 회귀 추정 방법의 해 경로는 단일 조정 모수에 따라 다릅니다. Elastic Net의 해 경로는 가능도 벌점에 대한 조정 모수 및 Elastic Net 알파에 따라 다릅니다. Elastic Net의 가능도에 대한 벌점은 Lasso 회귀 및 능형 회귀 추정 방법과 관련된 벌점의 가중 합입니다. Elastic Net 알파는 이러한 두 벌점의 가중치를 결정합니다. 자세한 내용은 추정 방법에 대한 통계 상세 정보 및 고급 컨트롤에 대한 통계 상세 정보에서 확인하십시오.
조정 모수가 0이면 해에 벌점이 부과되지 않고 최대 가능도 추정값이 계산됩니다. 조정 모수가 증가하면 벌점이 증가합니다.
해는 선택한 검증 방법과 관련하여 벌점이 부과된 음의 로그 가능도 함수를 최소화하는 모수 추정값 집합입니다. 현재 해는 해 경로 그림에서 빨간색 수직 실선으로 지정됩니다.
참고: 해 경로 그림에서 척도화된 모수 추정값 크기가 감소하면 조정 모수 값이 증가합니다. MLE에 가까운 추정값은 큰 크기와 관련이 있고 벌점이 크게 부과된 추정값은 작은 크기와 관련이 있습니다.
다음 사항에 유의하십시오.
• 조정 모수가 너무 작으면 일반적으로 데이터가 과대적합되어 분산이 큰 모형이 생성됩니다.
• 조정 모수가 너무 크면 일반적으로 데이터가 과소적합됩니다.
해를 얻기 위해 미세 격자에서 조정 모수가 증가합니다.
• Lasso 회귀, Elastic Net 알파가 지정된 Elastic Net 및 능형 회귀의 경우 해를 제공하는 조정 모수의 값은 조정 모수 격자에서 최량 적합을 제공하는 값입니다.
참고: "Elastic Net 알파"는 기본적으로 0.99로 설정되어 있습니다.
• "Elastic Net 알파"에 값을 설정하지 않으면 알파 값도 미세 격자에서 증가합니다. 조정 모수의 값이 고정된 경우 알파는 연속된 10개의 알파 값이 검증 방법에 의해 결정된 최량 적합을 개선하지 못할 때까지 변경됩니다. 이 과정은 조정 모수 값의 전체 격자에 대해 반복됩니다. 조정 모수 및 알파의 최종 값은 조정 모수 격자에서 최량 적합을 제공하는 값입니다.
조정 모수 값 격자의 범위는 대부분의 경우 0부터 모든 비절편 항이 0인 가장 작은 값까지입니다. 모든 비절편 항이 0인 조정 모수의 가장 작은 값을 상한으로 정의합니다. 조정 모수의 하한은 0.0001로 설정되는 다음 두 경우를 제외하고 0입니다.
• 설계 행렬이 특이 행렬인 경우 최대 가능도 추정값을 계산할 수 없습니다. 0.0001 하한을 사용하면 MLE에 가까운 추정값을 계산할 수 있습니다.
• 이항 또는 다항 분포를 선택한 경우 0.0001 하한을 사용하면 분리를 방지할 수 있습니다.
효과 유전성 적용
관련 고차 효과보다 저차 효과를 먼저 모형에 입력해야 합니다. 즉, 대부분의 경우 X가 모형에 없으면 X2도 모형에 없다는 의미입니다. 그러나 "전진 선택"을 제외한 다른 추정 방법의 경우 모형에 X2이 추가되고 동일한 단계에서 X가 제거될 수 있습니다. 이 옵션은 데이터 테이블에 DOE 스크립트가 포함된 경우 활성화되지만 기본적으로 해제되어 있습니다.
Elastic Net 알파
Elastic Net에 대한 a 모수를 설정합니다. 이 a 모수는 Elastic Net 계수를 추정할 때 l1 및 l2 벌점 조정 모수의 혼합을 결정합니다. 기본값은 a = 0.99이며, 이는 l1 벌점의 계수를 0.99로 설정하고 l2 벌점의 계수를 0.01로 설정합니다. 이 옵션은 "추정 방법"에 "Elastic Net"을 선택한 경우에만 사용할 수 있습니다. 자세한 내용은 추정 방법에 대한 통계 상세 정보에서 확인하십시오.
격자 점 수
조정 모수에 대한 하한과 상한 사이의 격자점 수를 지정합니다. 각 격자점 값에서 해당 조정 모수 값에 대한 모수 추정값을 얻습니다. 기본 격자점 수는 150개입니다.
최소 벌점률
조정 모수의 상한에 대한 하한 비율의 최소값을 나타냅니다. 조정 모수의 하한이 0이면 해가 MLE를 제공합니다. MLE 또는 MLE에 매우 가까운 해를 포함하지 않으려는 경우 "최소 벌점률"을 0이 아닌 값으로 설정할 수 있습니다. 이중 Lasso 회귀 추정 방법의 경우 이 옵션에 지정된 값은 적합의 첫 번째 단계에서만 사용됩니다. 설계 행렬에 특이성이 있으면 기본값이 0.0001입니다. 그렇지 않으면 기본값이 0입니다.
격자 척도
격자 척도의 분포를 선택하는 옵션을 제공합니다. 선형, 제곱근 또는 로그 척도 중에서 선택할 수 있습니다. 선택한 척도에 따라 지정된 격자 점 수와 같은 수의 격자 점이 조정 모수의 하한과 상한 사이에 분포됩니다. 기본 격자 척도는 제곱근입니다. 자세한 내용은 고급 컨트롤에 대한 통계 상세 정보에서 확인하십시오.
첫 번째 단계 해
이중 Lasso 회귀 및 2단계 전진 선택의 첫 번째 단계에서 해를 선택하는 옵션을 제공합니다. 기본적으로 지정된 검증 방법에 따라 최량 적합 해가 선택되고 초기에 표시됩니다(최량 적합). 녹색 또는 노란색 영역에 있는 l1 노름 값이 더 크거나 더 작은 모형을 초기에 표시하도록 선택할 수 있습니다. 예를 들어 "노란색 영역에서 가장 작음"을 선택할 경우 초기에 표시되는 해는 노란색 영역에서 l1 노름이 가장 작은 모형입니다. 자세한 내용은 비교 가능 모형 영역에서 확인하십시오.
최대 효과 수
최량 부분집합 추정 방법에 대해 모형에서 고려할 최대 효과 수를 지정합니다. 이 옵션을 사용하여 모형 적합에 필요한 계산 수를 제한할 수 있습니다. 기본값은 10입니다.
초기에 표시된 해
"해 경로" 보고서에서 현재 모형으로 초기에 표시되는 해를 선택하는 옵션을 제공합니다. 현재 모형은 수직 실선으로 식별됩니다. 자세한 내용은 현재 모형 표시자에서 확인하십시오. 최량 적합 해는 수직 점선으로 식별됩니다. 기본적으로 지정된 검증 방법에 따라 최량 적합으로 간주되는 해가 표시됩니다.
녹색 또는 노란색 영역에 있는 l1 노름 값이 더 크거나 더 작은 모형을 초기에 표시하도록 선택할 수 있습니다. 예를 들어 "노란색 영역에서 가장 작음"을 선택할 경우 초기에 표시되는 해는 노란색 영역에서 l1 노름이 가장 작은 모형입니다. 자세한 내용은 비교 가능 모형 영역에서 확인하십시오.
적응형 벌점 가중치
적응형 이중 Lasso 회귀의 두 번째 단계에서 사용되는 벌점 가중치를 계산하는 옵션을 제공합니다. 기본적으로 "역 해" 옵션이 선택되어 있습니다. 이 옵션은 첫 번째 단계 적합의 모수 추정값을 사용하여 벌점 가중치를 계산합니다.
"역 모형 평균" 옵션은 AICc 또는 BIC 모형의 가중 평균인 해의 모수 추정값을 사용하여 벌점 가중치를 계산합니다. AICc 검증 방법을 선택하는 경우 AICc 모형이 사용됩니다. 그렇지 않은 경우 BIC 모형이 사용됩니다. "역 모형 평균" 옵션을 사용하면 최대 가능도 해(있는 경우)가 적응형 이중 Lasso 회귀 모형의 해 경로에서 맨 오른쪽 점으로 나타납니다.
항 강제 적용
모형에 강제로 적용할 항(있는 경우)을 선택할 수 있습니다. 모형에 강제 적용된 항은 벌점에 포함되지 않습니다.