모형 적합 옵션"일반화 회귀" 보고서의 각 모형 적합에는 다음 옵션이 포함된 빨간색 삼각형 메뉴가 있습니다.
주의: 시작 창에서 표현식 데이터 유형 또는 벡터 모델링 유형이 있는 열을 지정하면 플랫폼의 많은 옵션을 사용할 수 없습니다. SVEM 모형 적합 옵션은 자체 검증 앙상블 모형에 대한 모형 적합 옵션에서 확인하십시오.
회귀 보고서
지정된 모형 적합에 대해 표시되는 보고서를 사용자 정의할 수 있습니다. 다음 보고서 중 "중심화 및 척도화된 예측 변수에 대한 모수 추정값" 보고서와 "활성 모수 추정값" 보고서를 제외한 모든 보고서가 기본적으로 표시됩니다.
모형 요약
모형에 대한 규격 및 적합도 통계량 정보를 포함하는 "모형 요약" 보고서를 표시하거나 숨깁니다. 이 옵션은 적용 가능한 모형에 대한 "추정 상세 정보" 보고서도 표시합니다. 자세한 내용은 모형 요약 및 추정 상세 정보에서 확인하십시오.
해 경로
(최대 가능도 모형에는 사용 불가능) 해 경로 및 검증 경로 그림을 표시하거나 숨깁니다. 자세한 내용은 해 경로에서 확인하십시오.
중심화 및 척도화된 예측 변수에 대한 모수 추정값
중심화 및 척도화된 모수 추정값 테이블을 표시하거나 숨깁니다. 자세한 내용은 중심화 및 척도화된 예측 변수에 대한 모수 추정값에서 확인하십시오.
원래 예측 변수에 대한 모수 추정값
데이터의 원래 척도로 표현된 모수 추정값 테이블을 표시하거나 숨깁니다. 자세한 내용은 원래 예측 변수에 대한 모수 추정값에서 확인하십시오.
활성 모수 추정값
(최대 가능도 또는 능형 회귀 모형에는 사용 불가능) 현재 선택된 모형에 대한 활성 또는 0이 아닌 모수 추정값 테이블을 표시하거나 숨깁니다.
해 경로 요약 표시
(최대 가능도 또는 능형 회귀 모형에는 사용 불가능) 해 경로 그림과 검증 경로 그림에서 활성 집합이 변경되는 점에 대한 적합 통계량 테이블이 포함된 보고서를 표시하거나 숨깁니다. 사용 가능한 통계량은 추정 방법에 따라 다릅니다. BIC 검증을 사용한 정규 Lasso 회귀 모형에 사용할 수 있는 조건부 모형 확률에 대한 자세한 내용은 Hu et al. 연구 자료 (2019)에서 확인하십시오. BIC, AICc 또는 ERIC 검증을 지정하면 BIC 및 AICc 열의 셀에 검증 그림과 동일한 방식으로 색상이 적용됩니다. 자세한 내용은 비교 가능 모형 영역에서 확인하십시오.
효과 검정
각 효과에 대한 검정을 표시하거나 숨깁니다. 각 효과 검정은 해당 효과와 관련된 모든 모수가 0이라는 귀무가설을 검정합니다. 명목형 또는 순서형 효과에는 수준 수에 따라 관련된 모수가 여러 개 있을 수 있습니다. 이러한 효과에 대한 효과 검정은 관련된 모든 모수가 0인지 여부를 검정합니다. 다항 분포를 지정한 경우에는 전체 반응 수준에 대해 효과가 결합됩니다. 자세한 내용은 효과 검정에서 확인하십시오.
예측 표현식 표시
추정된 모형에 대한 방정식을 포함하는 "예측 표현식" 보고서를 표시하거나 숨깁니다. 예는 예측 표현식 표시에서 확인하십시오.
0이 아닌 항 선택
(능형 회귀 추정 방법이 지정된 경우에는 사용 불가능) 보고서에서 계수가 0이 아닌 항을 강조 표시합니다. 또한 데이터 테이블에서 관련된 모든 열을 선택합니다.
0인 항 선택
(능형 회귀 추정 방법이 지정된 경우에는 사용 불가능) 보고서에서 계수가 0인 항을 강조 표시합니다. 또한 데이터 테이블에서 관련된 모든 열을 선택합니다.
활성 집합 다시 시작
(벡터 모델링 유형이 있는 예측 변수가 포함된 모형에는 사용 불가능) 모수 추정값이 0이 아닌 항을 기반으로 한 항 집합이 "모형 효과 생성" 목록에 포함된 "모형 적합" 시작 창을 여는 옵션이 포함되어 있습니다. 이러한 항은 활성 효과입니다. 시작 창의 다른 모든 규격은 원래 분석에 사용된 것과 같습니다.
참고: 기준 변수가 포함된 보고서에서 "활성 집합 다시 시작" 옵션 중 하나를 선택하는 경우 기준 변수는 "모형 적합" 시작 창에 추가되지 않습니다.
활성 효과를 사용하여 다시 시작
활성 효과만 사용하여 "모형 효과 생성" 목록을 채웁니다.
활성 주효과 및 2차 요인 적합 다시 시작
활성 효과를 사용하여 생성된 2차 요인으로 "모형 효과 생성" 목록을 채웁니다.
활성 주효과 및 3차 요인 적합 다시 시작
활성 효과를 사용하여 생성된 3차 요인으로 "모형 효과 생성" 목록을 채웁니다.
활성 주효과 및 완전 요인 적합 다시 시작
활성 효과를 사용하여 생성된 완전 요인으로 "모형 효과 생성" 목록을 채웁니다.
활성 주효과 및 2차 다항식 적합 다시 시작
활성 효과를 사용하여 생성된 2차 다항식으로 "모형 효과 생성" 목록을 채웁니다.
활성 주효과 및 3차 다항식 적합 다시 시작
활성 효과를 사용하여 생성된 3차 다항식으로 "모형 효과 생성" 목록을 채웁니다.
활성 주효과 및 반응 표면 모형 다시 시작
활성 효과를 사용하여 생성된 반응 표면 모형으로 "모형 효과 생성" 목록을 채웁니다.
비활성 경로 숨기기
현재 활성화되지 않은 경로는 흐리게 나타나도록 해 경로 모수 추정값 그림에서 비활성 경로의 투명도를 조정합니다.
승산비
(이항 분포가 지정되고 모형에 절편이 포함된 경우에만 사용 가능하며, 벡터 모델링 유형이 있는 예측 변수가 포함된 모형에는 사용 불가능) 범주형 예측 변수에 대한 승산비와 연속형 예측 변수에 대한 단위 승산비 및 범위 승산비가 포함된 보고서를 표시하거나 숨깁니다. 승산비는 두 사건에 대한 승산 비율입니다. 한 사건의 승산은 관심 사건이 발생할 확률 대 발생하지 않을 확률의 비율입니다. 관심 사건은 "모형 적합" 시작 창의 "목표 수준"에 정의됩니다.
각 범주형 예측 변수에 대해 승산비 보고서가 나타납니다. 범주형 모형 항의 모든 수준 조합에 대해 승산비가 표시됩니다.
연속형 예측 변수가 있는 경우 다음과 같은 두 개의 추가 보고서가 나타납니다.
– 단위 승산비 보고서. 단위 승산비는 연속형 모형 항의 1단위 변화에 대해 계산됩니다.
– 범위 승산비 보고서. 범위 승산비는 연속형 모형 항의 전체 범위에 대해 계산됩니다.
승산비 보고서의 신뢰 구간은 Wald 기반 구간입니다. 모형 항에 대한 승산비는 해당 모형 항이 고차 효과에 포함되지 않은 경우에만 의미가 있습니다.
참고: 모형에 교호작용이 있으면 "다중 비교" 옵션을 사용하여 승산비를 구할 수 있습니다. 자세한 내용은 다중 비교에서 확인하십시오.
발생률 비율
(Poisson 또는 음이항 분포가 지정되고 모형에 절편이 포함된 경우에만 사용 가능) 범주형 예측 변수에 대한 발생률 비율과 연속형 예측 변수에 대한 단위 발생률 비율 및 범위 발생률 비율이 포함된 보고서를 표시하거나 숨깁니다. 발생률 비율은 두 사건에 대한 발생률 비율입니다. 모형 항의 발생률은 주어진 기간 동안 새로 발생하는 사건 수입니다.
각 범주형 예측 변수에 대해 발생률 비율 보고서가 나타납니다. 범주형 모형 항의 모든 수준 조합에 대해 발생률 비율이 표시됩니다.
연속형 예측 변수가 있는 경우 다음과 같은 두 개의 추가 보고서가 나타납니다.
– 단위 발생률 비율 보고서. 단위 발생률 비율은 연속형 모형 항의 1단위 변화에 대해 계산됩니다.
– 범위 발생률 비율 보고서. 범위 발생률 비율은 연속형 모형 항의 전체 범위에 대해 계산됩니다.
발생률 비율 보고서의 신뢰 구간은 Wald 기반 구간입니다. 모형 항에 대한 발생률 비율은 해당 모형 항이 고차 효과에 포함되지 않은 경우에만 의미가 있습니다.
위험 비율
(Cox 비례 위험 분포가 지정된 경우에만 사용 가능) 범주형 예측 변수에 대한 위험 비율과 연속형 예측 변수에 대한 단위 위험 비율 및 범위 위험 비율이 포함된 보고서를 표시하거나 숨깁니다. 위험 비율은 두 사건에 대한 위험률의 비율입니다. 시간 t에서 사건의 위험률은 사건이 시간 t까지 생존했다고 가정할 때 추가 시간 동안 생존하지 못할 조건부 확률입니다.
각 범주형 예측 변수에 대해 위험 비율 보고서가 나타납니다. 범주형 모형 항의 모든 수준 조합에 대해 위험 비율이 표시됩니다.
연속형 예측 변수가 있는 경우 다음과 같은 두 개의 추가 보고서가 나타납니다.
– 단위 위험 비율 보고서. 단위 위험 비율은 연속형 모형 항의 1단위 변화에 대해 계산됩니다.
– 범위 위험 비율 보고서. 범위 위험 비율은 연속형 모형 항의 전체 범위에 대해 계산됩니다.
위험 비율 보고서의 신뢰 구간은 Wald 기반 구간입니다. 모형 항에 대한 위험 비율은 해당 모형 항이 고차 효과에 포함되지 않은 경우에만 의미가 있습니다.
추정값 공분산
모수 추정값의 공분산을 보여 주는 행렬을 표시하거나 숨깁니다. 이러한 값은 M-추정 및 샌드위치 계산식(Zou 2006, Huber and Ronchetti 2009)을 사용하여 계산됩니다. 공분산 행렬은 0인 항을 포함하지 않습니다.
추정값 상관계수
모수 추정값의 상관계수를 보여 주는 행렬을 표시하거나 숨깁니다. 이러한 값은 M-추정 및 샌드위치 계산식(Zou 2006, Huber and Ronchetti 2009)을 사용하여 계산됩니다. 상관 행렬은 0인 항을 포함하지 않습니다.
역추정 예측
(벡터 모델링 유형이 있는 예측 변수가 포함된 모형에는 사용 불가능) Y 및 다른 X 변수에 대한 특정 값이 주어졌을 때 X 값을 예측합니다. 이 옵션은 연속형 변수를 예측하는 데만 사용할 수 있습니다. 역추정 예측에 대한 자세한 내용은 역추정 예측에서 확인하십시오.
다중 비교
(벡터 모델링 유형이 있는 예측 변수가 포함된 모형 또는 범주형 예측 변수가 포함되지 않은 모형에는 사용 불가능) "다중 비교" 시작 창을 표시합니다. "다중 비교" 시작 창과 보고서에 대한 자세한 내용은 다중 비교에서 확인하십시오. 다중 비교는 선형 예측 변수 척도에서 수행됩니다. 이항 분포가 지정되면 승산비에 대해 다중 비교가 수행됩니다. Poisson 분포가 지정되면 발생률 비율에 대해 다중 비교가 수행됩니다. Cox 비례 위험 분포가 지정되면 위험 비율에 대해 다중 비교가 수행됩니다.
혼동 행렬
(이항, 다항 또는 순서형 로지스틱 분포가 지정된 경우에만 사용 가능) 실제 반응 수준과 예측 반응 수준을 테이블 형식으로 생성하는 행렬을 표시하거나 숨깁니다. 적합한 모형은 예측 반응 수준이 실제 반응 수준과 동일해야 합니다. 혼동 행렬을 사용하면 예측 반응이 실제 반응에 잘 맞는지 평가할 수 있습니다. 오분류 비율은 비대각 결과를 요약합니다. 검증을 사용한 경우 훈련 데이터 집합, 검증 데이터 집합 및 테스트 데이터 집합에 대해 각각 혼동 행렬이 표시됩니다.
확률 임계 설정
(이항 분포가 지정된 경우에만 사용 가능) 반응을 분류하기 위한 경계 확률을 지정합니다. 기본적으로 관측값은 예측 확률이 0.5를 초과할 경우 목표 수준으로 분류됩니다. 임계값을 변경하여 목표 수준으로 분류하기 위한 경계를 0.5 이외의 값으로 지정합니다. 혼동 행렬의 예측 비율과 오분류 비율은 지정된 임계값에 따른 분류를 반영하도록 업데이트됩니다.
반응에 "수익 행렬" 열 특성이 있는 경우 수익 행렬에 의해 확률 임계 초기값이 결정됩니다.
프로파일러
(벡터 모델링 유형이 있는 예측 변수가 포함된 모형에는 사용 불가능) 적합 모형을 탐색할 수 있는 다양한 프로파일러를 제공합니다.
참고: 행 수가 500보다 작거나 같고 예측 변수의 수가 30보다 작거나 같은 경우 해 경로 그림에서 현재 모형 표시자를 드래그하면 프로파일러 그림이 계속 업데이트됩니다. 그렇지 않은 경우에는 마우스 버튼을 놓으면 그림이 업데이트됩니다.
프로파일러
예측 프로파일러를 표시하거나 숨깁니다. 모수 추정값이 0이고, 계수가 0이 아닌 교호작용 항에 포함되지 않은 예측 변수는 프로파일러에 나타나지 않습니다. 예측 프로파일러에 대한 자세한 내용은 프로파일러의 프로파일러에서 확인하십시오.
분포 프로파일러
(이항 또는 분위수 회귀 분포가 지정된 경우에는 사용 불가능) 예측 변수 및 반응의 누적 분포 함수 프로파일러를 표시하거나 숨깁니다. 반응은 맨 오른쪽 셀에 표시됩니다.
분위수 프로파일러
(이항 또는 분위수 회귀 분포가 지정된 경우에는 사용 불가능) 예측 반응을 예측 변수의 함수 및 누적 분포 함수의 분위수로 보여 주는 프로파일러를 표시하거나 숨깁니다. 분위수는 "확률"이라고 하며 맨 오른쪽 셀에 표시됩니다.
생존 프로파일러
(정규, 지수, Weibull, 로그 정규 또는 Cox 비례 위험 분포가 지정된 경우에만 사용 가능) 생존 함수를 예측 변수 및 반응의 함수로 보여 주는 프로파일러를 표시하거나 숨깁니다. 반응은 맨 오른쪽 셀에 표시됩니다.
위험 프로파일러
(정규, 지수, Weibull, 로그 정규 또는 Cox 비례 위험 분포가 지정된 경우에만 사용 가능) 위험률을 예측 변수 및 반응의 함수로 보여 주는 프로파일러를 표시하거나 숨깁니다. 반응은 맨 오른쪽 셀에 표시됩니다.
사용자 검정
사용자 가설을 검정할 수 있는 "사용자 검정" 보고서를 표시하거나 숨깁니다. 모형에 해 경로가 있는 경우 해를 업데이트하면 사용자 검정 결과가 업데이트됩니다. 사용자 검정에 대한 자세한 내용은 사용자 검정에서 확인하십시오. "사용자 검정"의 빨간색 삼각형 메뉴에는 사용자 검정 보고서를 제거하는 옵션이 포함되어 있습니다.
진단 그림
현재 모형이 얼마나 적합한지 평가하는 데 도움이 되는 다양한 그림을 제공합니다. 검증 열을 지정하거나 "검증 방법"에서 "K 폴드", "홀드백" 또는 "Leave-One-Out"을 선택한 경우 아래 옵션을 사용하여 훈련 데이터 집합, 검증 데이터 집합 및 테스트 데이터 집합(해당하는 경우)을 보거나, 이러한 데이터 집합에 대해 별도의 그림을 생성할 수 있습니다. "K 폴드" 또는 "Leave-One-Out"을 선택한 경우 그림은 예측 오차를 최적화하는 검증 데이터 집합 및 이에 대한 훈련 데이터 집합에 해당합니다. 자세한 내용은 K 폴드에서 확인하십시오.
참고: 해 경로 그림에서 현재 모형 표시자를 드래그하면 모든 진단 그림이 계속 업데이트됩니다.
진단 번들
(이항, 다항, 순서형 로지스틱 또는 Cox 비례 위험 분포가 지정된 경우에는 사용 불가능) 잔차 대 예측값 그림, 잔차 대 행 번호 그림, 잔차 히스토그램 및 관측된 반응보다 더 큰 반응이 관측될 확률 히스토그램을 포함하는 네 개의 그래프를 표시하거나 숨깁니다.
모든 관측값을 사용하여 그래프가 생성됩니다. 검증 열을 사용하거나 "검증 방법"에서 "K 폴드", "홀드백" 또는 "Leave-One-Out"을 선택한 경우 체크박스를 사용하여 훈련 데이터 집합, 검증 데이터 집합 및 테스트 데이터 집합(해당하는 경우)을 선택할 수 있습니다. 데이터 테이블에서 이러한 데이터 집합에 해당하는 행이 선택되고 그래프에서 해당 점과 영역이 강조 표시됩니다. 이 옵션을 사용하여 모형 적합이 전체 데이터 집합에서 유사한지 여부를 판별할 수 있습니다.
"더 큰 반응이 관측될 적합 확률" 히스토그램은 모형의 적합도를 평가하는 데 도움이 됩니다. 다음과 같이 분포에 따라 다른 기준이 적용됩니다.
– 영과잉 분포와 분위수 회귀를 제외한 다른 분포의 경우 "올바른" 모형은 거의 균등한 값 분포를 표시해야 합니다.
– 영과잉 분포의 경우 히스토그램은 0에 점질량을 표시하고 다른 곳에서는 거의 균등한 분포를 표시해야 합니다.
– 분위수 회귀의 경우 히스토그램은 지정된 분위수 왼쪽에는 거의 균등한 값 분포를 표시하고 지정된 분위수 오른쪽에는 약간 더 높은 값을 거의 균등한 분포로 표시해야 합니다.
기준 생존 및 위험 그림
(Cox 비례 위험 분포가 지정된 경우에만 사용 가능) 반응 변수에 대한 기준 비례 위험 함수의 생존 및 위험 함수를 보여 주는 "기준 생존 및 위험" 그림을 표시하거나 숨깁니다. 아래에는 그림에 표시된 값이 포함된 테이블이 있습니다.
참고: Cox 비례 위험 분포가 지정된 경우 "진단 그림"에 "기준 생존 및 위험 그림" 옵션만 있습니다.
ROC 곡선
(이항, 다항 또는 순서형 로지스틱 분포가 지정된 경우에만 사용 가능) ROC(Receiver Operating Characteristic) 곡선을 표시하거나 숨깁니다. 검증을 사용한 경우 훈련 데이터 집합, 검증 데이터 집합 및 테스트 데이터 집합에 대해 각각 ROC 곡선이 표시됩니다.
ROC 곡선은 반응 수준을 올바르게 분류하기 위한 적합 확률 능력을 측정합니다. 대각과 곡선의 거리가 멀수록 적합도가 높습니다. ROC 곡선에 대한 소개는 기본 분석의 ROC 곡선에서 확인하십시오.
반응 수준이 세 개 이상이면 ROC 곡선 그림에 각 반응 수준에 대한 ROC 곡선이 표시됩니다. 주어진 반응 수준에 대해 이 곡선은 해당 수준으로 올바르게 분류하기 위한 ROC 곡선입니다. ROC 곡선에 대한 자세한 내용은 예측 및 전문 모델링의 ROC 곡선에서 확인하십시오.
정밀도-재현율 곡선
(이항, 다항 또는 순서형 로지스틱 분포가 지정된 경우에만 사용 가능) 정밀도-재현율 곡선 그림을 표시하거나 숨깁니다. 정밀도-재현율 곡선은 다양한 임계값에서 정밀도 값 대 재현율 값을 표시합니다. 검증을 사용한 경우 훈련 데이터 집합, 검증 데이터 집합 및 테스트 데이터 집합에 대해 각각 그림이 표시됩니다.
반응 수준이 세 개 이상이면 그림에 각 반응 수준에 대한 정밀도-재현율 곡선이 포함됩니다. 주어진 반응 수준에 대해 이 곡선은 해당 수준으로 올바르게 분류하기 위한 정밀도-재현율 곡선입니다. 정밀도-재현율 곡선에 대한 자세한 내용은 예측 및 전문 모델링의 정밀도-재현율 곡선에서 확인하십시오.
향상도 곡선
(이항, 다항 또는 순서형 로지스틱 분포가 지정된 경우에만 사용 가능) 모형에 대한 향상도 곡선을 표시하거나 숨깁니다. 검증을 사용한 경우 훈련 데이터 집합, 검증 데이터 집합 및 테스트 데이터 집합에 대해 각각 ROC 곡선이 표시됩니다.
향상도 곡선은 적합 확률이 감소할 때 반응 수준이 얼마나 효과적으로 분류되는지 보여 줍니다. 적합 확률은 가로 축을 따라 내림차순으로 표시됩니다. 적합 확률의 수직 좌표는 해당 확률 이상에 대한 올바른 분류 비율을 전체 올바른 분류 비율로 나눈 값입니다. 적합 확률이 임계값을 초과하는 관측값만 선택한 경우 향상도 곡선을 사용하여 대부분의 관측값을 올바르게 분류할 수 있는지 확인할 수 있습니다.
반응 수준이 세 개 이상이면 향상도 곡선 그림에 각 반응 수준에 대한 향상도 곡선이 표시됩니다. 주어진 반응 수준에 대해 이 곡선은 해당 수준으로 올바르게 분류하기 위한 향상도 곡선입니다. 향상도 곡선에 대한 자세한 내용은 예측 및 전문 모델링의 향상도 곡선에서 확인하십시오.
결정 임계값
(이항 범주형 반응에만 사용 가능) 훈련, 검증 및 테스트(지정된 경우) 데이터 집합에 대한 "결정 임계값" 보고서를 표시하거나 숨깁니다. 각 보고서에는 모형 적합을 비교할 수 있도록 각 모형에 대한 적합 확률 분포 그래프, 각 모형에 대한 혼동 행렬 및 분류 그래프가 포함되어 있습니다. "결정 임계값" 보고서에 대한 자세한 내용은 예측 및 전문 모델링의 결정 임계값 보고서에서 확인하십시오.
실제값 대 예측값 그림
(이항, 다항, 순서형 로지스틱 또는 Cox 비례 위험 분포가 지정된 경우에는 사용 불가능) 세로 축에 실제 Y 값을 표시하고 가로 축에 예측 Y 값을 표시합니다. 검증을 사용한 경우 훈련 데이터 집합, 검증 데이터 집합 및 테스트 데이터 집합에 대해 각각 그림이 표시됩니다.
잔차 대 예측값 그림
(이항, 다항, 순서형 로지스틱 또는 Cox 비례 위험 분포가 지정된 경우에는 사용 불가능) 세로 축에 잔차를 표시하고 가로 축에 예측 Y 값을 표시합니다. 검증을 사용한 경우 훈련 데이터 집합, 검증 데이터 집합 및 테스트 데이터 집합에 대해 각각 그림이 표시됩니다.
예측 변수별 잔차 도표화
(이항, 다항, 순서형 로지스틱 또는 Cox 비례 위험 분포가 지정되거나, 벡터 모델링 유형이 있는 예측 변수가 포함된 모형에는 사용 불가능) 모형의 각 예측 변수에 대해 세로 축에 잔차를 표시하고 가로 축에 예측 변수 값을 표시합니다. 모형의 예측 변수에 대해 각각 하나씩 그림이 있습니다. 검증을 사용한 경우 훈련 데이터 집합, 검증 데이터 집합 및 테스트 데이터 집합에 대해 각각 그림이 표시됩니다.
정규 분위수 그림
(정규 분포가 지정되고 중도절단이 없는 경우에만 사용 가능) 세로 축에 정규 분위수를 나타내고 가로 축에 표준화 잔차를 나타내는 그림을 표시하거나 숨깁니다. 검증을 사용한 경우 훈련 데이터 집합, 검증 데이터 집합 및 테스트 데이터 집합에 대해 각각 그림이 표시됩니다.
열 저장
적합 모형을 기반으로 한 열을 데이터 테이블에 저장할 수 있습니다. "분포"에서 "Cox 비례 위험"을 선택한 경우 사용할 수 있는 옵션에 대한 내용은 Cox 비례 위험 모형의 열 저장 옵션에서 확인하십시오. 다른 모든 분포의 경우 다음 열을 데이터 테이블에 저장할 수 있습니다.
함수 예측 계산식 저장
(반응 열에 "FDE FPC 수" 열 특성이 포함된 경우에만 사용 가능) 새 열을 원래 데이터 테이블에 저장합니다. 각 FDE 주성분 반응에 대한 새 열이 추가됩니다. 각 새 열에는 각 함수 주성분에 대한 예측 계산식이 포함됩니다. 함수 데이터 탐색기 플랫폼의 고유 함수 열과 예측 계산식의 선형 결합인 모형 예측 계산식을 포함하는 마지막 열이 추가됩니다. 스크립트가 데이터 테이블에 추가됩니다. 이 스크립트를 사용하면 모형 예측 계산식을 사용하여 원래 반응을 프로파일링할 수 있습니다. 반응은 FDE 주성분 반응 열의 "FDE 출력" 열 특성에 지정됩니다. 함수 주성분에 대한 자세한 내용은 예측 및 전문 모델링의 함수 데이터 탐색기에서 확인하십시오.
참고:"함수 예측 계산식 저장" 옵션은 보고서 창에서 모든 FDE 주성분 반응에 대한 계산식 열을 저장합니다. 단일 반응에 여러 모형이 적합된 경우 각 반응의 최종 모형을 사용하여 해당 반응에 대한 예측 계산식을 생성합니다.
예측 계산식 저장
새 계산식 열을 원래 데이터 테이블에 저장합니다. 새 열에는 관측된(표준화되지 않음) 데이터 값에 대한 예측 계산식이 포함됩니다. 예측 계산식은 0인 항을 포함하지 않습니다. 평균 계산식에 대한 자세한 내용은 분포에 대한 통계 상세 정보에서 확인하십시오.
반응 열이 범주형인 경우 이 옵션은 각 반응 수준에 대한 확률 열과 최대 확률 분류 반응이 포함된 열을 생성합니다. 최대 확률 분류 반응 열에는 모형에 따른 확률이 가장 높은 수준이 포함됩니다. 확률 임계값이 0.5가 아닌 경우 이 옵션은 확률 임계값을 기반으로 최대 확률 분류 반응을 포함하는 추가 열을 생성합니다.
평균 신뢰 구간
두 개의 새 계산식 열을 원래 데이터 테이블에 저장합니다. 새 열에는 평균 반응에 대한 95% 신뢰 하한과 신뢰 상한이 포함됩니다.
참고:"모형 적합" 창의 "모형 규격" 빨간색 삼각형 메뉴에서 "유의 수준 설정"을 선택하여 신뢰 구간의 a 수준을 변경할 수 있습니다.
예측값의 표준 오차
새 열을 원래 데이터 테이블에 저장합니다. 새 열에는 예측 평균 반응의 표준 오차가 포함됩니다.
예측값의 표준 오차 계산식
새 계산식 열을 원래 데이터 테이블에 저장합니다. 새 열에는 예측 평균 반응의 표준 오차 계산식이 포함됩니다.
잔차 계산식 저장
새 계산식 열을 원래 데이터 테이블에 저장합니다. 새 열에는 Y에서 예측 계산식을 뺀 형식으로 제공되는 잔차 계산식이 포함됩니다. 잔차 계산식은 0인 항을 포함하지 않습니다. "분포"에서 "이항"을 선택한 경우에는 사용할 수 없습니다.
분산 계산식 저장
새 계산식 열을 원래 데이터 테이블에 저장합니다. 새 열에는 예측 분산에 대한 계산식이 포함됩니다. 예측 분산은 선택한 분포의 분산 계산식을 사용하여 계산됩니다. 연결 함수에 관련된 모수의 값은 추정된 선형 성분에 역 연결 함수를 적용하여 추정됩니다. 다른 모수는 모수 추정값으로 대체됩니다. 분산 계산식에 대한 자세한 내용은 분포에 대한 통계 상세 정보에서 확인하십시오. "분포"에서 "이항"을 선택한 경우에는 사용할 수 없습니다.
선형 예측 변수 저장
새 계산식 열을 원래 데이터 테이블에 저장합니다. 새 열에는 설계 행렬과 모수 추정값 벡터의 곱을 구하는 계산식이 포함됩니다. 일반적으로 이것을 Xb라고 합니다. 이 계산식은 0인 항을 포함하지 않습니다.
검증 열 저장
(K 폴드, 홀드백 또는 Leave-One-Out 검증 방법이 지정된 경우에만 사용 가능) 새 열을 원래 데이터 테이블에 저장합니다. 새 열은 폴드에 대한 행 할당을 설명합니다. K 폴드의 경우 행이 할당된 폴드가 열에 나열됩니다. 홀드백의 경우 각 행은 훈련 데이터 집합 또는 검증 데이터 집합에 속하는 것으로 식별됩니다. Leave-One-Out의 경우 행 값은 해당 행이 제외되는 순서를 나타냅니다.
참고:시작 창에서 검증 열을 선택한 경우 "검증 열 저장" 옵션이 나타나지 않습니다.
분포 계산식 저장
(이항 또는 분위수 회귀 분포가 지정된 경우에는 사용 불가능) 새 계산식 열을 원래 데이터 테이블에 저장합니다. 새 열에는 누적 분포 함수에 대한 계산식이 포함됩니다.
생존 계산식 저장
(연속형 분포가 지정된 경우에만 사용 가능) 새 계산식 열을 원래 데이터 테이블에 저장합니다. 새 열에는 관측된 시간의 생존 확률에 대한 계산식이 포함됩니다. 생존 함수는 1에서 누적 분포 함수를 뺀 값과 같습니다.
시뮬레이션 계산식 저장
새 계산식 열을 원래 데이터 테이블에 저장합니다. 새 열에는 적합 모형에 대한 추정 모수를 사용하여 시뮬레이션 값을 생성하는 계산식이 포함됩니다. 이 열은 "시뮬레이션" 유틸리티에서 "스위치 인할 열"로 사용할 수 있습니다. 자세한 내용은 기본 분석의 시뮬레이션에서 확인하십시오.
Cook 거리 영향력
(정규 분포 및 표준 최소 제곱 추정 방법이 지정된 경우에만 사용 가능) 새 열을 원래 데이터 테이블에 저장합니다. 새 열에는 Cook 거리 영향력 통계량 값이 포함됩니다.
해트 값
(정규 분포 및 표준 최소 제곱 추정 방법이 지정된 경우에만 사용 가능) 새 열을 원래 데이터 테이블에 저장합니다. 새 열에는 X(X‘X)-1X‘의 대각 요소가 포함됩니다. 이러한 값을 해트 값이라고도 합니다.
예측 계산식 게시
예측 계산식을 생성하여 계산식 저장소 플랫폼에 계산식 열 스크립트로 저장합니다. "계산식 저장소" 보고서가 열려 있지 않으면 "계산식 저장소" 보고서가 생성됩니다. 자세한 내용은 예측 및 전문 모델링의 계산식 저장소에서 확인하십시오.
생존 계산식 저장
새 계산식 열을 원래 데이터 테이블에 저장합니다. 새 열에는 관측된 시간의 생존 확률에 대한 계산식이 포함됩니다.
Cox Snell 잔차 계산식 저장
새 계산식 열을 원래 데이터 테이블에 저장합니다. 새 열에는 Cox-Snell 잔차에 대한 계산식이 포함됩니다. Cox-Snell 잔차는 양수입니다. Cox-Snell 잔차에 대한 자세한 내용은 Meeker and Escobar 연구 자료(1998, sec. 17.6.1)에서 확인하십시오.
Martingale 잔차 계산식 저장
새 계산식 열을 원래 데이터 테이블에 저장합니다. 새 열에는 Martingale 잔차에 대한 계산식이 포함됩니다. Martingale 잔차는 개인에 대해 관측된 사건 수와 조건부 기대 사건 수 간의 차이로 정의됩니다. Martingale 잔차의 평균은 0이고 범위는 음의 무한대와 1 사이입니다. 자세한 내용은 Fleming and Harrington 연구 자료(1991)에서 확인하십시오.
선형 예측 변수 저장
새 계산식 열을 원래 데이터 테이블에 저장합니다. 새 열에는 설계 행렬과 모수 추정값 벡터의 곱을 구하는 계산식이 포함됩니다. 일반적으로 이것을 Xb라고 합니다. 이 계산식은 0인 항을 포함하지 않습니다.
적합 제거
보고서에서 지정된 모형 적합을 제거합니다.