체지방률을 여러 신체 계측값의 함수로 예측하는 모형을 생성하려고 합니다. 아래 단계에 따라 신경망 모형을 생성합니다.
1. 도움말 > 샘플 데이터 폴더를 선택하고 Body Fat.jmp를 엽니다.
2. 분석 > 예측 모델링 > 신경망을 선택합니다.
3. Percent body fat을 선택하고 Y, 반응을 클릭합니다.
4. 다른 모든 열(Age (years) ~ Wrist circumference (cm))을 선택하고 X, 요인을 클릭합니다.
5. 확인을 클릭합니다.
6. 홀드백 비율에 "0.2"를 입력합니다.
7. 난수 시드값에 "1234"를 입력합니다.
참고: 일반적으로 검증 데이터 집합을 선택하는 랜덤 특성 때문에 결과가 달라집니다. 위의 시드값을 입력하면 이 예에 표시된 결과를 재현할 수 있습니다.
8. 공변량 변환 옵션을 선택합니다.
9. 시작을 클릭합니다.
그림 3.3 신경망 보고서
훈련 데이터 집합과 검증 데이터 집합에 대한 보고서가 둘 다 제공됩니다. 검증 데이터 집합의 결과를 미래 관측값에 대한 모형의 예측 검정력을 나타내는 데 사용합니다.
검증 데이터 집합의 R²은 0.792입니다. 이 값은 모형이 체지방률을 잘 예측하고 있으며 모형의 예측이 검증 데이터 집합의 실제값과 거의 일치한다는 것을 나타냅니다.
10. "모형 NTanH(3)" 옆의 빨간색 삼각형을 클릭하고 실제값 대 예측값 그림을 선택합니다. 이 그림을 통해 모형 적합을 추가적으로 평가할 수 있습니다.
그림 3.4 실제값 대 예측값 그림
점이 선을 따라 분포되어 있으므로 예측값이 실제값과 유사하다는 것을 알 수 있습니다.
11. X 변수가 예측값에 미치는 영향에 대한 전반적인 이해를 위해 "모형 NTanH(3)" 옆의 빨간색 삼각형을 클릭하고 프로파일러를 선택합니다.
12. "예측 프로파일러"의 빨간색 삼각형을 클릭하고 모양 > 행으로 배열을 선택합니다.
13. "가로로 배치할 그림의 수" 옆에 "7"을 입력합니다.
그림 3.5 예측 프로파일러
프로파일러의 기울기가 양수인 변수도 있고 음수인 변수도 있습니다. 예를 들어 Weight (lbs) 변수의 기울기는 양수입니다. 이는 체중이 높을수록 체지방률(Percentage body fat)이 높다는 것을 나타냅니다. Height (inches) 변수는 참가자의 키 측정값(인치)입니다. 이 변수의 기울기는 음수이며, 이는 Height (inches) 값이 증가할수록 예측 Percentage body fat 값이 감소하는 경향이 있음을 나타냅니다.