프로파일러 > 프로파일러 > 예측 프로파일러의 추가 예 > 단일 반응에 대한 변수 중요도의 예
발행일 : 03/10/2025

단일 반응에 대한 변수 중요도의 예

이 예에서는 예측 프로파일러의 "변수 중요도 평가" 옵션을 사용하여 신경망에서 모델링된 반응을 예측하는 데 중요한 변수를 평가합니다. 이 옵션은 신경망과 같이 공식 가설 검정을 수용하지 않는 모형에 유용합니다.

결과가 여기에 표시된 것과 다를 수 있지만 거의 비슷합니다. 이 예에는 확률 변동의 두 가지 소스가 있습니다. 신경망을 적합시킬 때 k 폴드 교차 검증이 사용됩니다. 이렇게 하면 데이터가 훈련 데이터 집합과 검증 데이터 집합으로 랜덤 분할됩니다. 또한 몬테카를로 표집을 사용하여 요인 중요도 지수를 계산합니다.

1. 도움말 > 샘플 데이터 폴더를 선택하고 Candy Bars.jmp를 엽니다.

2. 분석 > 예측 모델링 > 신경망을 선택합니다.

3. "열 선택" 목록에서 Calories를 선택하고 Y, 반응을 클릭합니다.

4. "열 선택" 목록에서 다른 모든 연속형 열을 선택하고 X, 요인을 클릭합니다.

5. 확인을 클릭합니다.

6. 신경망 "모형 시작" 패널의 "검증 방법" 아래 목록에서 K 폴드를 선택합니다.

"K 폴드"를 선택하면 "폴드 수"가 기본적으로 5로 설정됩니다.

7. (선택 사항) "난수 시드값" 옆에 "123"을 입력합니다.

참고: 신경망 모형에서 검증 데이터 집합 선택의 랜덤 특성으로 인해 결과가 달라집니다. 위의 시드값을 입력하면 이 예에 표시된 결과를 재현할 수 있습니다.

8. 시작을 클릭합니다.

9. "모형 NTanH(3)" 옆의 빨간색 삼각형을 클릭하고 프로파일러를 선택합니다.

"예측 프로파일러"가 보고서 맨 아래에 표시됩니다. 나중에 비교할 수 있도록 요인 순서에 주목하십시오.

요인이 서로 상관되어 있으므로 변수 중요도 평가를 위한 표집 방법으로 "종속 재표집 입력"을 선택하여 이 점을 고려합니다.

10. "예측 프로파일러"의 빨간색 삼각형을 클릭하고 변수 중요도 평가 > 종속 재표집 입력을 선택합니다.

그림 3.27 종속 재표집 입력 보고서 

Dependent Resampled Inputs Report

"변수 중요도: 종속 재표집 입력" 보고서가 나타납니다. 보고서에서 "총 효과" 지수의 크기에 따라 예측 프로파일러 셀이 재정렬되었는지 확인합니다. Figure 3.27에서 "총 효과" 중요도 지수는 Total fat gCarbohydrate g를 예측 반응에 가장 큰 영향을 미치는 요인으로 식별합니다(각각 0.437과 0.28). 마찬가지로 Oz/pkgProtein g도 총 효과가 양수이지만 크기가 약간 작습니다(각각 0.185와 0.112).

요인이 상관되어 있다고 가정하여 얻은 중요도 지수를 요인이 독립적이라고 가정했을 때 얻는 중요도 지수와 비교하는 데 관심이 있을 수 있습니다.

11. "예측 프로파일러"의 빨간색 삼각형을 클릭하고 변수 중요도 평가 > 독립 재표집 입력을 선택합니다.

그림 3.28 독립 재표집 입력 보고서 

Independent Resampled Inputs Report

이 예에서는 관련된 분포가 균등하지 않으므로 재표집 입력 옵션이 적합합니다. "변수 중요도: 독립 재표집 입력" 보고서에서도 Total fat gCarbohydrate g가 예측값에 가장 큰 영향을 미치는 요인으로 식별되었습니다(각각 0.514와 0.379). 마찬가지로 Protein gOz/pkg도 총 효과가 양수이지만 크기가 유의하게 작습니다(각각 0.05와 0.03). Figure 3.27의 결과와 비교하면 Total fat gCarbohydrate에 대한 총 효과 중요도 지수는 약간 증가한 반면 Oz/pkgProtein g의 총 효과 중요도 지수는 크게 감소했습니다. 이는 사용된 재표집 방법에 따라 변수 중요도 측도에 변동이 있음을 강조합니다.

더 많은 정보를 원하십니까? 질문이 있습니까? JMP 사용자 커뮤니티에서 답변 받기 (community.jmp.com).