판별 분석은 연속형 변수에 대한 값으로 설명되는 관측값을 그룹으로 분류하려고 시도합니다. 범주형 변수 X로 정의되는 소속 그룹은 연속형 변수에 의해 예측됩니다. 이러한 변수를 공변량이라고 하며 Y로 나타냅니다.
판별 분석은 로지스틱 회귀와 다릅니다. 로지스틱 회귀에서 분류 변수는 확률 변수이며 연속형 변수에 의해 예측됩니다. 판별 분석에서 분류는 고정되어 있으며 공변량(Y)이 확률 변수의 구현입니다. 그러나 두 기법 모두 연속형 변수에 의해 범주형 값이 예측됩니다.
판별 플랫폼에서는 모형 적합을 위한 네 가지 방법을 제공합니다. 모든 방법은 Mahalanobis 거리를 사용하여 각 관측값에서 각 그룹의 다변량 평균(중심)까지의 거리를 추정합니다. 소속 그룹의 사전 확률을 지정할 수 있으며 이러한 확률은 거리 계산에서 고려됩니다. 관측값은 가장 근접한 그룹으로 분류됩니다.
다음과 같은 적합 방법을 사용할 수 있습니다.
• 선형—그룹 내 공분산 행렬이 같다고 가정합니다. X에 의해 정의되는 그룹의 공변량 평균은 서로 다르다고 간주됩니다.
• 2차—그룹 내 공분산 행렬이 다르다고 가정합니다. 이 방법은 선형 방법보다 더 많은 모수를 추정해야 합니다. 그룹 표본 크기가 작으면 추정값이 불안정할 수 있습니다.
• 정규화—그룹 내 공분산 행렬이 다를 때 추정값에 안정성을 부여하는 두 가지 방법을 제공합니다. 이 옵션은 그룹 표본 크기가 작을 때 유용합니다.
• 와이드 선형—다른 방법을 사용하면 계산상 문제가 발생할 수 있는 다수의 공변량을 기반으로 모형을 적합시키는 데 유용합니다. 이 경우 모든 공분산 행렬이 같다고 가정합니다.