예측 및 전문 모델링 > K 최근접 이웃 > K 최근접 이웃 플랫폼 시작
발행일 : 03/10/2025

Image shown hereK 최근접 이웃 플랫폼 시작

분석 > 예측 모델링 > K 최근접 이웃을 선택하여 K 최근접 이웃 플랫폼을 시작합니다.

그림 7.4 K 최근접 이웃 시작 창 

K Nearest Neighbors Launch Window

"열 선택"의 빨간색 삼각형 메뉴에 포함된 옵션에 대한 자세한 내용은 열 필터 메뉴JMP 사용에서 확인하십시오.

K 최근접 이웃 시작 창에는 다음과 같은 옵션이 있습니다.

Y, 반응

분석할 하나 이상의 반응 변수입니다.

참고: K 최근접 이웃 플랫폼은 반응 변수가 없는 경우에도 인접 관측값 사이의 거리를 결정하는 유틸리티로 사용할 수 있습니다. 반응 변수를 지정하지 않으면 빈 보고서가 나타납니다. 그러나 빨간색 삼각형 메뉴의 "근접 이웃 행 저장" 및 "근접 이웃 거리 저장" 옵션을 사용할 수 있습니다.

X, 요인

예측 변수입니다.

검증

검증 데이터 집합을 정의하는 숫자 열입니다. 이 열에는 최대 세 개의 구분되는 값이 포함되어야 합니다.

검증 열에 두 개의 수준이 있는 경우 더 작은 값이 훈련 데이터 집합을 정의하고 더 큰 값이 검증 데이터 집합을 정의합니다.

검증 열에 세 개의 수준이 있는 경우 작은 값부터 순서대로 훈련 데이터 집합, 검증 데이터 집합, 테스트 데이터 집합을 각각 정의합니다.

검증 열에 네 개 이상의 수준이 있는 경우 가장 작은 세 개의 값을 포함하는 행이 검증 데이터 집합을 정의합니다. 다른 모든 행은 분석에서 제외됩니다.

K 최근접 이웃 플랫폼에서는 검증 열을 사용하여 모형을 훈련 및 조정하거나 모형을 훈련, 조정 및 평가합니다. 검증에 대한 자세한 내용은 JMP 모델링의 검증에서 확인하십시오.

"열 선택" 목록에서 아무 열도 선택하지 않은 상태로 "검증" 버튼을 클릭하면 데이터 테이블에 검증 열을 추가할 수 있습니다. "검증 열 생성" 유틸리티에 대한 자세한 내용은 검증 열 생성에서 확인하십시오.

기준

개별 분석을 정의하는 수준이 포함된 하나 이상의 열입니다. 지정된 열의 각 수준에 대해 해당 행은 사용자가 지정한 다른 변수를 사용하여 분석됩니다. 결과는 개별 보고서에 제공됩니다. 기준 변수가 둘 이상 할당되면 기준 변수의 가능한 각 수준 조합에 대해 개별 보고서가 생성됩니다.

검증 데이터 비율

검증 데이터 집합으로 사용할 데이터 비율입니다.

이웃 수, K

분석할 최근접 이웃의 최대 수입니다. 모형은 K에 지정한 값까지 하나의 최근접 이웃에 대해 적합됩니다.

참고: 최대 이웃 수 K는 훈련 데이터 테이블의 행 수에서 1을 뺀 값 이하여야 합니다. 허용 가능한 최대 K보다 큰 K를 지정하면 경고가 나타납니다.

범주 편향

범주형 반응의 적합 확률이 항상 양수가 되도록 보증하는 조정 모수를 지정합니다. 개수가 0이 되지 않도록 하기 위해 관측값 수에 편향 값의 비율이 추가됩니다. 이 절차에서는 적합 확률이 항상 양수가 되도록 0의 로그를 계산하지 않습니다. 범주 편향 값은 0에서 1 사이여야 합니다. 기본값은 0.5입니다.

난수 시드값 설정

명목형 및 순서형 반응에 대한 우선 순위 결정에 사용되는 난수화 과정의 시드값을 설정합니다. "검증 데이터 비율"을 지정하는 경우 이 옵션은 검증에 사용되는 행의 시드값도 설정합니다. "난수 시드값 설정"은 분석을 재현하려는 경우에 유용합니다. 난수 시드값을 설정하고 스크립트를 저장하면 시드값이 스크립트에 자동으로 저장됩니다.

더 많은 정보를 원하십니까? 질문이 있습니까? JMP 사용자 커뮤니티에서 답변 받기 (community.jmp.com).