"최소 제곱 적합" 보고서의 "효과 레버리지 그림" 옵션은 다음과 같이 유용합니다.
• X에 대한 가설 검정에 영향을 미칠 수 있는 점을 확인할 수 있습니다.
• 일반적이지 않은 패턴과 모형 가정 위반을 발견할 수 있습니다.
• 다중공선성 문제를 발견할 수 있습니다.
효과에 대한 레버리지 그림에서는 다른 효과가 이미 모형에 있는 경우 이 효과를 모형에 추가할 때 미치는 영향을 보여 줍니다. 설명을 위해 단일 연속형 효과 X에 대한 효과 레버리지 그림을 생성하는 경우를 가정해 보겠습니다. 더 일반적인 상황에서 가로 축 척도에 대한 자세한 내용은 가로 축 척도화에서 확인하십시오.
X를 제외한 모든 예측 변수에 대해 반응 Y가 회귀 분석되고 잔차가 계산됩니다. 이러한 잔차를 Y 잔차라고 합니다. 그런 다음 모형의 다른 모든 예측 변수에 대해 X가 회귀 분석되고 잔차가 계산됩니다. 이러한 잔차를 X 잔차라고 합니다. X 잔차에는 모형에서 X를 제외하고 계산된 Y 잔차에 있는 정보 외에 추가 정보가 포함될 수 있습니다.
기본적으로 X에 대한 효과 레버리지 그림은 Y 잔차에 대한 X 잔차의 산점도입니다(Figure 3.41). JMP는 그림을 해석하고 다른 그림과 비교하는 데 도움이 되도록 Y의 평균을 Y 잔차에 추가하고 X의 평균을 X 잔차에 추가합니다. 변환된 Y 잔차를 Y 레버리지 잔차라고 하고 변환된 X 잔차를 X 레버리지 값이라고 합니다. 효과 레버리지 그림의 점은 이러한 X 레버리지와 Y 레버리지 잔차 쌍입니다.
JMP는 이러한 점과 평균에 대한 신뢰 대역에 최소 제곱선을 적합시킵니다. 적합선은 빨간색 실선이고 신뢰 대역은 빨간색으로 음영 처리됩니다. 최소 제곱선의 기울기는 Y가 X 및 다른 예측 변수에 대해 회귀 분석되는 모형에서 X에 대한 계수의 추정값입니다. 파란색 수평 파선은 Y 레버리지 잔차의 평균에 설정됩니다. 이 선은 X 잔차가 Y 잔차와 선형 관계가 없는 상황을 설명합니다. 적합선의 기울기가 0이 아닌 경우 모형에 X를 추가하면 변동을 설명하는 데 유용할 수 있습니다.
Figure 3.39에서는 잔차가 레버리지 그림에 어떻게 표시되는지 보여 줍니다. 점에서 적합선까지의 거리는 효과를 포함하는 모형의 잔차입니다. 점에서 수평선까지의 거리는 모형에 효과가 없을 때의 잔차 오차입니다. 즉, 레버리지 그림의 평균 선은 모수(효과)의 가설 값이 0으로 제한된 모형을 나타냅니다.
그림 3.39 일반 레버리지 그림의 예
적합선에 대한 신뢰 곡선이 레버리지 그림에 표시됩니다. 이러한 곡선은 관심 검정이 5% 수준(또는 "모형 적합" 시작 창의 "유의 수준 설정"에 지정한 수준)에서 유의한지 여부를 시각적으로 보여 줍니다. 곡선 사이의 신뢰 영역에 가설을 나타내는 수평선이 포함되어 있으면 효과가 유의하지 않습니다. 곡선이 선과 교차하면 효과가 유의합니다. Figure 3.40의 예를 참조하십시오.
그림 3.40 레버리지 그림에 표시된 유의성 비교
예측 변수 X의 모델링 유형이 연속형이면 가로 축이 X 단위로 척도화됩니다. 가로 축 범위는 X 값 범위를 반영합니다. 레버리지 그림에서 적합선 기울기는 X에 대한 모수 추정값입니다. Figure 3.41의 왼쪽 그림을 참조하십시오.
효과가 명목형 또는 순서형이거나, 교호작용과 같은 복합 효과인 경우 가로 축에 효과의 값을 직접 나타낼 수 없습니다. 이 경우 가로 축은 반응 단위로 척도화되고 적합선은 기울기가 1인 대각선입니다. "전체 모형" 레버리지 그림(모든 모수 값이 0이라는 가설이 지정됨)에는 이 척도화가 사용됩니다. 자세한 내용은 레버리지 그림에 대한 통계 상세 정보에서 확인하십시오. 이 그림의 경우 가로 축은 Figure 3.41의 오른쪽 그림에 표시된 것처럼 전체 모형에 대한 예측 반응 값을 기준으로 척도화됩니다.
단순 회귀 분석에서 선형 효과에 대한 레버리지 그림은 기존의 예측 변수에 대한 실제 반응 값 그림과 동일합니다.
이러한 그림은 모형에 효과를 포함하기 위한 검정에서 점의 영향을 시각화하는 데 도움이 되므로 레버리지라는 용어가 사용됩니다. 그림의 중심에서 수평으로 멀리 떨어진 점은 중심에 가까운 점보다 효과 검정에 더 많은 영향을 미칩니다. 효과 검정에는 잔차 제곱합을 해당 효과가 제거된 모형의 잔차 제곱합과 비교하는 과정이 포함됩니다. 극단에서는 가설의 제약을 받기 전과 후의 잔차 차이가 비교적 큰 경향이 있습니다. 따라서 이러한 잔차는 해당 효과의 가설 검정에 대한 제곱합에 더 크게 기여합니다.
다중공선성은 두 개 이상의 예측 변수가 밀접하게 관련되어 있거나, 좀 더 엄밀히 말하면 거의 선형 종속 관계에 관련된 상태를 의미합니다. 다중공선성이 존재하면 표준 오차가 팽창되고 모수 추정값이 불안정해질 수 있습니다. 효과가 다른 예측 변수와 동일 선상에 있으면 점의 가로 값이 그림의 가운데 쪽으로 모이는 경향이 있습니다. 이 상황은 적합선의 기울기가 불안정함을 나타냅니다.
"효과 레버리지 그림" 옵션은 모형의 각 효과에 대한 레버리지 그림을 생성합니다. 실제값 대 예측값 그림도 레버리지 그림으로 간주할 수 있습니다. 이 그림을 사용하면 모형의 모든 모수(절편 제외)가 0이라는 검정을 시각화할 수 있습니다. 동일한 검정이 "분산 분석" 보고서에서 분석적으로 수행됩니다. 이 그림에 대한 자세한 내용은 레버리지 그림에 대한 통계 상세 정보에서 확인하십시오.
Figure 3.41에서는 전체 모형에 대한 "실제값 대 예측값 그림"과 height 효과에 대한 "레버리지 그림"을 보여 줍니다. 왼쪽의 전체 모형 그림에서는 모든 효과를 검정합니다. 신뢰 곡선이 반응(weight)의 평균에서 수평선과 교차하므로 모형이 유의하다는 것을 추론할 수 있습니다. 또한 오른쪽의 height에 대한"레버리지 그림"에서는 모형에 age와 sex가 있더라도 height가 유의함을 보여 줍니다. 두 그림 모두 영향력 있는 점 또는 다중공선성과 관련된 문제를 나타내지 않습니다.
그림 3.41 전체 모형 및 효과 레버리지 그림