예측 및 전문 모델링 > 나이브 베이즈 > 나이브 베이즈의 추가 예
발행일 : 03/10/2025

Image shown here나이브 베이즈의 추가 예

나이브 베이즈를 사용하여 대부분의 예측 변수에 결측 데이터가 있는 데이터 집합으로 분류 모형을 생성합니다. 주택 담보 대출을 신청한 5,960명의 고객에 대한 과거 재무 데이터가 있습니다. 각 고객은 Good Risk(안전한 위험) 또는 Bad Risk(불안한 위험)로 분류되었습니다.

1. 도움말 > 샘플 데이터 폴더를 선택하고 Equity.jmp를 엽니다.

2. 분석 > 예측 모델링 > 나이브 베이즈를 선택합니다.

3. BAD를 선택하고 Y, 반응을 클릭합니다.

잠재적 예측 변수 중 하나인 DEBTINC에는 정보가 될 수 있는 결측값이 많이 있습니다. 그러나 나이브 베이즈는 많은 수의 결측값을 잘 처리할 준비가 되어 있지 않으므로 모형에 DEBTINC를 포함하지 않습니다.

4. LOAN ~ CLNO를 선택하고 X, 요인을 클릭합니다.

5. Validation을 선택하고 검증을 클릭합니다.

6. 확인을 클릭합니다.

그림 8.8 BAD에 대한 나이브 베이즈 보고서 

Naive Bayes Report for BAD

훈련, 검증 및 테스트 데이터 집합의 오분류 비율은 18%에서 19% 사이입니다. 모든 데이터 집합의 혼동 행렬은 Bad Risk 고객을 Good Risk 고객으로 분류한 것이 오분류의 가장 큰 원인임을 나타냅니다.

특정 재무 배경 값을 가진 고객이 High Risk로 분류될 확률에 관심이 있습니다.

7. "나이브 베이즈"의 빨간색 삼각형을 클릭하고 확률 계산식 저장을 선택합니다.

3개의 열 집합이 데이터 테이블에 추가됩니다.

세 개의 Naive 스코어 열에는 Good Risk, Bad Risk 및 이 둘의 합에 대한 Naive 스코어 계산식이 포함됩니다.

두 개의 Naive 확률 열에는 Good Risk와 Bad Risk에 대한 확률 계산식이 포함됩니다.

Naive 예측 계산식 Bad 열에는 관측값의 Naive 확률이 가장 높은 클래스에 관측값을 할당하는 계산식이 포함됩니다.

이 계산식을 사용하여 새 고객을 스코어링할 수 있습니다. 계산식 열에 대한 자세한 내용은 저장된 확률 계산식에 대한 통계 상세 정보에서 확인하십시오.

더 많은 정보를 원하십니까? 질문이 있습니까? JMP 사용자 커뮤니티에서 답변 받기 (community.jmp.com).