판별 플랫폼에서 판별 분석을 수행하는 데 사용할 수 있는 방법은 "선형", "2차", "정규화" 및 "와이드 선형"입니다. 처음 세 가지 방법은 기본 모형이 다릅니다. 와이드 선형 방법은 공변량 수가 많을 때 선형 모형을 적합시키는 효율적인 방법입니다.
참고: 공변량을 500개 넘게 입력하면 와이드 선형 방법으로 전환할 것을 제안하는 JMP 경고가 나타납니다. 열 수가 많은 경우 다른 방법을 사용하면 계산 시간이 길어질 수 있기 때문입니다. 와이드 선형 방법으로 전환하려면 와이드 선형, 복수 열을 클릭합니다. 원래 선택한 방법을 사용하려면 계속을 클릭합니다.
그림 5.5 선형, 2차 및 정규화 판별 분석
선형, 2차 및 정규화 방법이 Figure 5.5에 나와 있습니다. 여기에서는 각 방법을 간략하게 설명합니다. 자세한 내용은 저장된 계산식에 대한 통계 상세 정보에서 확인하십시오.
선형, 합동 공분산
선형 판별 분석을 수행합니다. 이 방법에서는 그룹 내 공분산 행렬이 같다고 가정합니다. 자세한 내용은 선형 판별 방법에서 확인하십시오.
2차, 각 공분산
2차 판별 분석을 수행합니다. 이 방법에서는 그룹 내 공분산 행렬이 다르다고 가정합니다. 이 방법은 선형 방법보다 더 많은 모수를 추정해야 합니다. 그룹 표본 크기가 작으면 추정값이 불안정할 수 있습니다. 자세한 내용은 2차 판별 방법에서 확인하십시오.
공변량이 X 변수의 수준에 대해 일정하면 그룹 내 공분산 행렬의 관련 항목은 공분산이 0입니다. 역행렬을 계산하기 위해 공분산 0은 해당하는 합동 그룹 내 공분산으로 대체됩니다. 이 작업이 완료되면 문제가 있는 공변량과 X 수준을 식별하는 노트가 보고서 창에 나타납니다.
팁: 데이터 집합이 작은 경우 2차 방법의 단점이 있습니다. 가역적이고 안정적인 공분산 행렬을 생성하기 어려울 수 있습니다. 정규화 방법은 그룹 간 차이를 허용하면서 이러한 문제를 개선합니다.
정규화, 절충 방법
그룹 내 공분산 행렬이 다를 때 추정값에 안정성을 부여하는 두 가지 방법을 제공합니다. 이 옵션은 그룹 표본 크기가 작을 때 유용합니다. 자세한 내용은 정규화, 절충 방법 및 정규화 판별 방법에서 확인하십시오.
와이드 선형, 복수 열
다른 방법을 사용하면 계산상 문제가 발생할 수 있는 다수의 공변량을 기반으로 모형을 적합시키는 데 유용합니다. 이 방법에서는 그룹 내 공분산 행렬이 모두 같다고 가정합니다. 이 방법은 특이값 분해 방식을 사용하여 합동 그룹 내 공분산 행렬의 역행렬을 계산합니다. 자세한 내용은 와이드 선형 알고리즘에 대한 통계 상세 정보에서 확인하십시오.
참고: "와이드 선형" 옵션을 사용하면 다른 판별 방법에 일반적으로 나타나는 몇 가지 기능을 사용할 수 없습니다. 이 알고리즘은 매우 큰 합동 그룹 내 공분산 행렬을 명시적으로 계산하지 않기 때문입니다.
정규화 판별 분석은 음수가 아닌 두 모수에 의해 관리됩니다.
• 첫 번째 모수(람다, 합동 공분산에 가깝게 축소)는 개별 공분산 행렬과 그룹 공분산 행렬을 혼합하는 방법을 지정합니다. 이 모수의 경우 1은 선형 판별 분석에 해당하고 0은 2차 판별 분석에 해당합니다.
• 두 번째 모수(감마, 대각 행렬에 가깝게 축소)는 비대각 요소(변수 간 공분산)에 적용할 수축 크기를 지정하는 승수입니다. 1을 선택하면 공분산 행렬이 강제로 대각화됩니다.
이 두 모수에 각각 0을 할당하면 2차 판별 분석을 요청하는 것과 동일합니다. 마찬가지로 람다에 1을 할당하고 감마에 0을 할당하면 선형 판별 분석이 요청됩니다. Table 5.1의 내용을 참조하면 정규화를 결정하는 데 도움이 됩니다. 선형, 2차 및 정규화 판별 분석의 예는 Figure 5.5에서 확인하십시오.
더 작은 람다 사용 | 더 큰 람다 사용 | 더 작은 감마 사용 | 더 큰 감마 사용 |
|---|---|---|---|
공분산 행렬이 다름 | 공분산 행렬이 같음 | 변수에 상관관계가 있음 | 변수에 상관관계가 없음 |
행 수가 많음 | 행 수가 적음 |
|
|
변수 수가 적음 | 변수 수가 많음 |
|
|