발행일 : 03/10/2025

결측값 탐색

결측값 탐색 및 대치

결측값 탐색 플랫폼은 데이터의 결측값을 식별하고 파악할 수 있는 여러 가지 방법을 제공합니다. 결측값에 대해 다변량 대치를 수행하는 방법도 있습니다. 이러한 결측값 대치법은 데이터의 결측이 랜덤이라고 가정합니다. 즉, 결측 데이터와 비결측 데이터 간의 차이를 연구에 포함된 다른 변수의 값으로 설명할 수 없다는 의미입니다. 결측값이 랜덤하지 않다고 의심되면 여러 플랫폼에서 사용할 수 있는 "결측값 정보화" 절차를 사용해 보십시오. 자세한 내용은 결측값 정보화의 선형 모형 적합에서 확인하십시오.

데이터 집합에 결측값이 있으면 해당 데이터를 사용하여 결론을 내릴 때 영향을 줄 수 있습니다. 예를 들어 건강한 몇몇 참가자가 종단 연구에서 빠지고 그들의 데이터가 계속 누락된 경우 연구 결과는 남아 있는 건강하지 않은 개인에게 편향될 수 있습니다. 결측 데이터 값을 식별해야 하며 추가 분석을 수행하기 전에 해당 값을 파악해야 합니다.

주의: 결측값 대치 후 데이터를 분석할 때는 결과가 편향될 가능성이 있으므로 주의해야 합니다. 원래 데이터 테이블의 복사본을 만들거나, 대치된 값이 있는 데이터를 새 파일에 저장하는 것이 가장 좋습니다.

그림 22.1 결측값 탐색의 예

Example of Explore Missing Values

결측값 탐색

결측값 탐색 및 대치

목차

결측값 탐색 플랫폼 개요

다변량 정규 대치법

다변량 SVD 대치법

다변량 RPCA 대치법

자동 데이터 결측값 대치

결측값 탐색 플랫폼의 예

결측값 탐색 플랫폼 시작

결측값 탐색 보고서

명령

결측값 대치 보고서

결측값 탐색 플랫폼 옵션