프로파일러 > 프로파일러 > 변수 중요도 평가
발행일 : 03/10/2025

변수 중요도 평가

"변수 중요도" 보고서에서는 모형 유형 및 적합 방법에 독립적인 방식으로 모형에서 요인의 중요도를 측정하는 지수를 계산합니다. 적합 모형은 예측값을 계산하는 데만 사용됩니다. 이 방법은 각 요인에 대한 변동 범위를 기반으로 예측 반응의 변동성을 추정합니다. 요인의 변동으로 인해 반응의 변동성이 크면 해당 효과는 모형과 관련하여 중요합니다.

참고: 일부 플랫폼에서는 수준이 세 개 이상인 범주형 반응에 대해 변수 중요도 평가를 사용할 수 없습니다.

"그래프" 메뉴를 통해 얻은 "예측 프로파일러"에서 "변수 중요도 평가"에 액세스할 수도 있습니다.

통계 상세 정보는 변수 중요도 평가에 대한 통계 상세 정보에서 확인하십시오. Saltelli(2002)의 내용도 참조하십시오.

참고: 변수 중요도를 평가하려면 모든 열이 동일한 데이터 테이블에 있어야 합니다.

변수 중요도 평가 보고서

"변수 중요도 평가" 메뉴에는 중요도 지수를 구성하는 데 사용되는 방법론을 다루는 다음과 같은 옵션이 있습니다.

독립 균등 입력

각 요인에 대해 관측된 최소값 및 최대값으로 정의된 균등 분포에서 몬테카를로 표본이 추출됩니다. 요인에 상관관계가 없으며 요인의 확률 값이 연구에 포함된 범위 전체에 균등하게 분포되어 있다고 생각되는 경우 이 옵션을 사용합니다. 이 옵션은 제약 조건이나 혼합물 요인을 포함하지 않는 설계된 실험에 적합합니다.

독립 재표집 입력

각 요인에 대해 관측값 집합을 재표집하여 몬테카를로 표본을 얻습니다. 요인에 상관관계가 없으며 요인의 확률 값이 균등 분포로 표현되지 않는다고 생각되는 경우 이 옵션을 사용합니다.

종속 재표집 입력

상관관계를 설명하기 위해 k 최근접 이웃 방법을 사용하여 관측된 조합에서 요인 값이 생성됩니다. 이 옵션은 관측된 분산 및 공분산을 요인의 공분산 구조를 나타내는 것으로 처리합니다. 요인에 상관관계가 있다고 생각될 때 이 옵션을 사용합니다. 이 옵션은 데이터 테이블의 행 수에 영향을 받습니다. 적은 수의 행과 함께 사용할 경우 결과를 신뢰할 수 없습니다.

참고: "독립 재표집 입력" 및 "종속 재표집 입력" 옵션은 관측 연구용입니다. 독립 옵션이 종속 옵션보다 빠르지만 종속 옵션이 다중공선성을 더 잘 처리하고 데이터에서 멀리 떨어진 영역으로 외삽하지 않습니다.

선형으로 제약된 입력

각 요인에 대해 선형 제약 조건으로 정의된 영역에 대한 균등 분포에서 몬테카를로 표본이 추출됩니다. 선형 제약 조건은 예측 프로파일러에서 정의하거나 설계된 실험과 관련하여 생성할 수 있습니다. 또한 표본은 관측된 최소값 및 최대값 내에 포함되도록 제한됩니다. 선형 제약 조건이 있을 때, 이러한 제약 조건이 입력 분포에 영향을 미친다고 생각되는 경우 이 옵션을 사용합니다.

이러한 알고리즘의 속도는 모형 평가 속도에 따라 달라집니다. 일반적으로 "독립 균등 입력" 옵션이 가장 빠르고 "종속 재표집 입력" 옵션이 가장 느립니다. 추정 프로세스를 즉시 완료할 수 없는 경우 "현재 지수 채택" 옵션을 사용할 수 있습니다.

참고: 변수 중요도 지수는 몬테카를로 표집을 사용하여 생성됩니다. 따라서 중요도 지수 값이 런마다 약간 다를 수 있습니다.

변수 중요도 보고서

각 변수 중요도 평가 옵션은 "요약 보고서"와 "주변 모형 그림"을 제공합니다. 변수 중요도 평가 보고서가 열리면 예측 프로파일러의 요인이 "총 효과" 중요도 지수에 따라 재정렬됩니다. 반응이 여러 개인 경우에는 "전체"의 "총 효과" 중요도 지수에 따라 요인이 재정렬됩니다. 여러 개의 변수 중요도 보고서를 실행하면 예측 프로파일러의 요인이 가장 최근 보고서의 "총 효과" 지수에 따라 정렬됩니다.

요약 보고서

각 반응에 대한 다음 요소가 테이블에 표시됩니다.

관심 요인입니다.

주효과

다른 요인과 결합하지 않고 해당 요인만의 상대 기여도를 반영하는 중요도 지수입니다.

총 효과

해당 요인을 단독으로 사용한 경우 및 다른 요인과 결합하여 사용한 경우의 상대 기여도를 반영하는 중요도 지수입니다. "총 효과" 열이 막대 차트로 표시됩니다. 자세한 내용은 가중치에서 확인하십시오.

주효과 표준 오차

주효과 중요도 지수의 몬테카를로 표준 오차입니다. 이 열은 보고서를 마우스 오른쪽 버튼으로 클릭하고 열 > 주효과 표준 오차를 선택하여 액세스할 수 있는 숨겨진 열입니다. 기본적으로 이 오차가 0.01보다 작을 때까지 표집이 계속됩니다. 계산에 대한 자세한 내용은 변수 중요도 표준 오차에서 확인하십시오. "종속 재표집 입력" 옵션에는 사용할 수 없습니다.

총 효과 표준 오차

총 효과 중요도 지수의 몬테카를로 표준 오차입니다. 이 열은 보고서를 마우스 오른쪽 버튼으로 클릭하고 열 > 총 효과 표준 오차를 선택하여 액세스할 수 있는 숨겨진 열입니다. 기본적으로 이 오차가 0.01보다 작을 때까지 표집이 계속됩니다. 계산에 대한 자세한 내용은 변수 중요도 표준 오차에서 확인하십시오. "종속 재표집 입력" 옵션에는 사용할 수 없습니다.

가중치

마지막 열의 오른쪽에 총 효과 지수를 표시하는 그림입니다. 보고서를 마우스 오른쪽 버튼으로 클릭하고 열 > 가중치를 선택하여 이 그림을 선택 취소하거나 다시 선택할 수 있습니다.

결측값을 사용한 함수 실행의 비율

일부 입력 조합에서 예측을 추정할 수 없는 몬테카를로 표본의 비율입니다. 비율이 0이 아니면 이 메시지가 테이블 하단에 노트로 나타납니다.

참고: 반응이 두 개 이상인 경우 "요약 보고서"에 "전체" 테이블과 각 반응에 대한 테이블이 차례로 나옵니다. "전체" 보고서의 중요도 지수는 모든 반응에 대한 중요도 지수의 평균입니다.

주변 모형 그림

"주변 모형 그림" 보고서(Figure 3.31)에는 각 반응에 대한 행과 요인에 대한 열이 있는 그림 행렬이 표시됩니다. 요인은 전체 총 효과 중요도 지수의 크기에 따라 정렬됩니다.

지정된 반응 및 요인에 대해 각 요인 값의 평균 반응이 그림에 표시되며 여기서 해당 평균은 중요도 지수 계산에 대한 모든 입력에 사용됩니다. 이러한 그림은 반응의 횡단면을 표시하는 프로파일러 그림과 다릅니다. 주변 모형 그림은 요인의 주효과를 평가하는 데 유용합니다.

선택한 입력 방법은 주변 모형 그림에 표시되는 값에 영향을 줍니다. 또한 그림은 생성된 입력 설정을 기반으로 하므로 표시된 평균 반응이 평활 곡선을 따르지 않을 수 있습니다.

빨간색 삼각형 메뉴 옵션을 사용하면 그림의 다음 요소를 표시하거나 숨길 수 있습니다.

추정값

요인 값의 함수로 계산된 시뮬레이션 값의 평균에 대한 평활 추정값입니다.

참고: 평균 추정값이 시뮬레이션되었으므로 분석을 다시 실행하면 값이 변경됩니다.

신뢰 구간

시뮬레이션된 평균에 대한 95% 신뢰 대역을 표시하거나 숨깁니다. 대개 이 대역은 좁기 때문에 척도를 확장하지 않으면 보이지 않을 수 있습니다. "종속 재표집 입력"에는 사용할 수 없습니다.

참고: 신뢰경계가 시뮬레이션되었으므로 분석을 다시 실행하면 대역이 변경됩니다.

데이터

요인 값에 대해 그림에 표시된 반응의 실제(시뮬레이션되지 않음) 값입니다.

변수 중요도 옵션

"변수 중요도"의 빨간색 삼각형 메뉴에는 다음 옵션이 포함되어 있습니다.

주효과 중요도별로 요인 재정렬

주효과의 중요도 지수("주효과")에 따라 예측 프로파일러의 셀을 재정렬합니다.

총 중요도별로 요인 재정렬

요인의 총 중요도 지수("총 효과")에 따라 예측 프로파일러의 셀을 재정렬합니다.

프로파일러 색 적용

빨강-흰색 강도 척도를 사용하여 총 효과 중요도 지수별로 프로파일러의 셀에 색상을 지정합니다.

참고: "요약 보고서"의 행을 클릭하여 데이터 테이블에서 열을 선택할 수 있습니다. 이 방법을 사용하면 추가 분석을 쉽게 수행할 수 있습니다.

더 많은 정보를 원하십니까? 질문이 있습니까? JMP 사용자 커뮤니티에서 답변 받기 (community.jmp.com).