결측값 탐색 플랫폼은 데이터의 결측값을 식별하고 파악할 수 있는 여러 가지 방법을 제공합니다. 결측값에 대해 다변량 대치를 수행하는 방법도 있습니다. 이러한 결측값 대치법은 데이터의 결측이 랜덤이라고 가정합니다. 즉, 결측 데이터와 비결측 데이터 간의 차이를 연구에 포함된 다른 변수의 값으로 설명할 수 없다는 의미입니다. 결측값이 랜덤하지 않다고 의심되면 여러 플랫폼에서 사용할 수 있는 "결측값 정보화" 절차를 사용해 보십시오. 자세한 내용은 결측값 정보화의 선형 모형 적합에서 확인하십시오.
데이터 집합에 결측값이 있으면 해당 데이터를 사용하여 결론을 내릴 때 영향을 줄 수 있습니다. 예를 들어 건강한 몇몇 참가자가 종단 연구에서 빠지고 그들의 데이터가 계속 누락된 경우 연구 결과는 남아 있는 건강하지 않은 개인에게 편향될 수 있습니다. 결측 데이터 값을 식별해야 하며 추가 분석을 수행하기 전에 해당 값을 파악해야 합니다.
주의: 결측값 대치 후 데이터를 분석할 때는 결과가 편향될 가능성이 있으므로 주의해야 합니다. 원래 데이터 테이블의 복사본을 만들거나, 대치된 값이 있는 데이터를 새 파일에 저장하는 것이 가장 좋습니다.
그림 22.1 결측값 탐색의 예