발행일 : 03/10/2025

산점도의 예

데이터

이 예에서는 442명의 당뇨병 환자 데이터를 사용합니다. 데이터에는 기준 임상 및 실험실 데이터뿐만 아니라 각 환자가 병원에 처음 내원한 후 1년 동안 얻은 당뇨병 진행 경과의 이진 측정값이 포함되어 있습니다. 이 측정값은 질병 경과를 Low 또는 High로 분류합니다.

기법

이 예에서는 공유 X 축, 축 사용자 정의 및 주석이 포함된 두 개의 산점도를 사용합니다.

목표

이 예의 목표는 두 분류 모형에서 높은 질병 경과(High)의 예측 확률을 비교하고 이해하는 것입니다.

분류 모형 실행

임상 및 실험실 변수를 기반으로 질병 경과를 예측하기 위해 분류 모형을 생성하려고 합니다. 두 가지 다른 분류 모형을 생성하고, 예측 계산식을 저장하고, 예측 분류를 비교합니다.

1. 도움말 > 샘플 데이터 폴더를 선택하고 Diabetes.jmp를 엽니다.

2. Decision Tree of Y Binary 스크립트 옆의 녹색 삼각형을 클릭하여 의사 결정 나무 예측 모형을 생성합니다.

3. "Y Binary에 대한 분할"의 빨간색 삼각형을 클릭하고 열 저장 > 예측 계산식 저장을 선택합니다. 이 창을 닫아도 됩니다.

이렇게 하면 확률 계산식이 데이터 테이블에 저장됩니다.

4. 데이터 테이블에서 확률(Y Binary= = High) 열을 마우스 오른쪽 버튼으로 클릭하고 열 정보를 선택합니다.

5. 열 이름을 Partition Prob High로 변경하고 확인을 클릭합니다.

6. Neural of Y Binary 스크립트 옆의 녹색 삼각형을 클릭하여 신경망 예측 모형을 생성합니다.

7. "모형 NTanH(3)"의 빨간색 삼각형을 클릭하고 프로파일 계산식 저장을 선택합니다. 이 창을 닫아도 됩니다.

이렇게 하면 확률 계산식이 데이터 테이블에 저장됩니다.

8. 데이터 테이블에서 확률(Y Binary=High) 열을 마우스 오른쪽 버튼으로 클릭하고 열 정보를 선택합니다.

9. 열 이름을 Neural Prob High로 변경하고 확인을 클릭합니다.

초기 그래프 생성

질병 경과가 높은(High) 환자의 모형 예측 확률을 비교합니다.

1. 그래프 > 그래프 빌더를 선택합니다.

2. Partition Prob High를 선택하여 X 영역으로 드래그합니다.

3. Neural Prob High를 선택하여 X 영역의 Partition Prob High 오른쪽으로 드래그합니다. 이렇게 하면 두 번째 X 축이 생성됩니다.

그림 4.18 Neural Prob High를 Partition Prob High 오른쪽으로 드래그 

Drag Neural Prob High to the Right of Partition Prob High

4. Y Binary를 선택하여 "중첩" 영역으로 드래그합니다.

5. "그래프 빌더"의 빨간색 삼각형을 클릭하고 그래프 간격을 선택합니다.

6. "그래프 간격" 옆에 "6"을 입력하고 확인을 클릭합니다.

이렇게 하면 두 X 축 사이의 간격이 증가합니다.

그림 4.19 모형 확률의 초기 그래프 

Initial Graph of Model Probabilities

그래프 사용자 정의

두 모델링 플랫폼에서 기본 임계값은 0.50입니다. 즉, 환자의 예측 확률이 0.50("High")보다 크면 모형이 해당 환자의 분류를 "High"로 예측합니다. 참조선을 사용하여 그래프에 임계값을 표시합니다.

1. Partition Prob High X 축을 마우스 오른쪽 버튼으로 클릭하고 축 설정을 선택합니다.

2. "척도" 섹션에서 역 순서 옆의 상자를 클릭합니다.

3. "눈금/계급 증분" 섹션에서 보조 눈금 수를 "2"로 설정합니다.

4. "참조선" 섹션에서 라벨 옆의 상자에 각각 "0.50"을 입력합니다.

5. "선 스타일" 옆의 상자에 "3"을 입력합니다. "3"은 참조선의 두께를 나타냅니다.

6. 추가를 클릭합니다.

그림 4.20 X 축 설정 

X Axis Settings

7. 확인을 클릭합니다.

8. Partition Prob High X 축을 마우스 오른쪽 버튼으로 클릭하고 편집 > 축 설정 복사를 선택합니다. Neural Prob High X 축을 마우스 오른쪽 버튼으로 클릭하고 편집 > 축 설정 붙여넣기를 선택합니다.

9. 완료를 클릭합니다.

그래프에 주석 달기

1. 메인 메뉴에서 도구 > 을 클릭합니다. Partition Prob High 그래프의 참조선 왼쪽에 가로선을 그립니다.

그림 4.21 Partition Prob High 참조선 왼쪽에 그린 선 

Line Drawn to the Left of the Partition Prob High Reference Line

2. 선을 마우스 오른쪽 버튼으로 클릭하고 끝 점을 선택합니다.

화살표가 참조선에서 먼 쪽을 가리켜야 합니다.

3. 메인 메뉴에서 도구 > 주석 달기를 클릭하고 화살표 위의 그래프를 클릭합니다.

4. 텍스트 상자에 Classified as "High"를 입력합니다. 자세한 내용은 Figure 4.22에서 확인하십시오.

5. Neural Prob High 그래프에서 step 1 ~ step 4를 반복합니다.

그림 4.22 예측 확률 분포 

Distribution of Predicted Probabilities

이 그래프에서는 예측 확률 분포가 두 모형 간에 차이가 있음을 보여 줍니다. Partition 모형에는 5개의 예측 스코어 수준이 있는 반면, Neural 모형 스코어는 스코어 범위 전체에 퍼져 있습니다. 두 모형 모두 각 그림의 오른쪽 끝에 파란색 데이터 점 군집이 있습니다. 이는 임계값의 오른쪽에 있으므로 두 모형에서 올바르게 분류되는 Low 개체입니다.

더 많은 정보를 원하십니까? 질문이 있습니까? JMP 사용자 커뮤니티에서 답변 받기 (community.jmp.com).