카이제곱 분포

카이제곱 분포란?

카이제곱 분포는 모집단에 대한 값의 이론적 분포입니다.

카이제곱 분포는 어떻게 사용되는가?

검정 통계량이 카이제곱 분포를 따르는 통계 검정에 사용됩니다. 카이제곱 분포에 의존하는 두 가지 일반적인 검정은 카이제곱 적합도 검정카이제곱 독립성 검정입니다.

 

카이제곱 분포 소개

카이제곱 분포는 여러 분포로 구성된 분포군입니다. 각 분포는 자유도에 의해 정의됩니다. (자유도는 적합도 검정독립성 검정 페이지에서 자세히 설명합니다) 아래 그림은 여러 가지 자유도의 세 가지 다른 카이제곱 분포를 보여줍니다.

그림 1: 서로 다른 자유도의 카이제곱 분포

자유도 8인 파란색 곡선은 정규 곡선(흔이 아는 종형 곡선)과 다소 비슷하게 나타납니다. 하지만 오른쪽 꼬리는 정규 분포보다 길고 대칭을 이루지 않습니다. 파란색 곡선을 자유도 4도의 주황색 곡선과 비교합니다. 주황색 곡선은 정규 곡선과 매우 다릅니다. 보라색 곡선은 자유도 3이며, 나머지 두 곡선보다 정규 곡선으로 보이지 않습니다.

카이제곱 분포의 자유도가 높을수록 정규 분포에 근접합니다.

출간된 카이제곱 테이블 사용

대부분의 사람이 소프트웨어를 사용하여 카이제곱 검정을 수행합니다. 하지만 많은 통계 책자에 카이제곱 테이블이 수록되어 있으므로 테이블 사용법을 알면 유용할 것입니다. 아래 절차는 일반적인 카이제곱 테이블을 사용하는 방법을 설명합니다.

  1. 유의 수준을 식별합니다. 테이블의 각 열에는 다양한 유의 수준 값이 나열됩니다. 검정 조건으로 α = 0.05로 설정하였으면 α = 0.05에 해당하는 열을 찾습니다.
  2. 수행 중인 검정 및 데이터의 자유도를 식별합니다. 카이제곱 테이블의 행은 서로 다른 자유도에 해당합니다. 대부분의 테이블에서 최대 자유도는 30입니다.
  3. 테이블에서 유의 수준과 자유도에 해당하는 셀을 찾습니다. 셀의 값이 카이제곱 분포 값입니다. 검정 통계량을 분포 값과 비교하여 적절한 결론을 내립니다.