"예측 프로파일러"의 빨간색 삼각형 메뉴에는 다음 옵션이 포함되어 있습니다.
최적화 및 만족도
다음 옵션으로 구성된 하위 메뉴입니다.
만족도 함수
만족도 함수를 표시하거나 숨깁니다. 만족도에 대한 내용은 만족도 프로파일링 및 최적화에서 설명합니다.
만족도 최대화
현재 요인 값을 만족도 함수가 최대화되도록 설정합니다. 반응 중요도 가중치를 고려합니다.
참고: 대부분의 경우 만족도 함수를 최적화하는 설정은 고유하지 않습니다. "만족도 최대화" 옵션은 이러한 설정 중 하나를 제공합니다. 등고선 프로파일러는 만족도를 최적화하는 대체 요인 조합을 찾는 데 유용한 도구입니다. 예는 등고선 프로파일러의 추가 예에서 확인하십시오.
참고: 요인의 "설계 역할" 열 특성 값이 "이산 수치형"이면 해당 요인은 만족도 함수 최적화에서 연속형으로 처리됩니다. 요인이 이산형 수준만 가정할 수 있다는 사실을 설명하기 위해 프로파일러에 범주형 항으로 표시되며 최적의 허용 수준이 선택됩니다.
최대화 및 저장
만족도 함수를 최대화하고 관련된 설정을 저장합니다.
최대화 옵션
최적화 설정을 구체화할 수 있는 "최대화 옵션" 창을 엽니다. 자세한 내용은 최대화 옵션 창에서 확인하십시오.
각 격자 점에 대해 최대화
하나 이상의 요인이 잠긴 경우에만 사용됩니다. 잠긴 요인의 범위가 격자로 나뉘고 각 격자 점에서 만족도가 최대화됩니다. 이 기능은 프로파일링하는 모형에 범주형 요인이 있는 경우에 유용합니다. 그런 다음 범주형 요인의 각 조합에 대한 최적 조건을 찾을 수 있습니다.
만족도 저장
각 반응에 대한 세 가지 만족도 함수 설정 및 관련된 만족도 값을 "반응 한계" 열 특성으로 데이터 테이블에 저장합니다. 이 값은 만족도 그림에서 핸들의 좌표에 해당합니다.
만족도 설정
특정 만족도 값을 설정할 수 있는 "반응 목표" 창을 엽니다.
그림 3.5 반응 목표 창
만족도 계산식 저장
만족도 계산식이 포함된 열을 데이터 테이블에 생성합니다. 계산식은 가능한 경우 적합 계산식을 사용하고, 적합 계산식에 액세스할 수 없는 경우 반응 변수를 사용합니다.
변수 중요도 평가
모형에 대한 요인의 중요도를 측정하는 지수를 계산하는 다양한 방법을 제공합니다. 이러한 지수는 모형 유형 및 적합 방법과 독립적입니다. 자세한 내용은 변수 중요도 평가에서 확인하십시오.
배깅된 예측 저장
(선택 모델링 플랫폼에 예측 프로파일러가 포함된 경우에만 사용 가능) "배깅" 창을 시작합니다. 붓스트랩 집계(배깅)를 사용하면 원래 데이터에서 복원 표집 방식으로 여러 훈련 데이터 집합을 생성할 수 있습니다. 각 훈련 데이터 집합에 대해 분석 플랫폼을 사용하여 모형이 적합되고 예측이 수행됩니다. 최종 예측은 모든 모형의 결과를 조합한 것입니다. 이렇게 하면 분산으로 인한 오차가 감소하여 예측 성능이 향상됩니다. 자세한 내용은 배깅에서 확인하십시오.
시뮬레이터
시뮬레이터를 시작합니다. 시뮬레이터에서는 모형의 요인 및 예측에 추가된 랜덤 잡음을 사용하여 몬테카를로 시뮬레이션을 생성할 수 있습니다. 고정 요인은 최적 설정으로 지정하고, 제어되지 않는 요인과 모형 잡음은 랜덤 값으로 설정하는 것이 일반적입니다. 그런 다음 규격 한계를 벗어나는 반응 비율을 확인합니다. 자세한 내용은 시뮬레이터에서 확인하십시오.
설계 영역 프로파일러
(연속형 요인이 하나 이상 있는 경우에만 사용 가능) 설계 영역 프로파일러를 표시하거나 숨깁니다. 설계 영역 프로파일러를 사용하면 반응 변수의 규격 한계를 준수하는 요인의 운용 한계를 결정할 수 있습니다. 자세한 내용은 설계 영역 프로파일러에서 확인하십시오.
교호작용 프로파일러
예측 프로파일러에서 요인 값을 업데이트하면 함께 업데이트되는 교호작용 그림을 표시하거나 숨깁니다. 요인의 현재 값이 변경될 때 그림이 어떻게 변하는지 확인하여 3차 교호작용을 시각화하려면 이 옵션을 사용합니다. 지정된 요인에 대해 변경되는 셀은 해당 요인을 직접 포함하지 않는 셀입니다. 반응이 두 개 이상인 경우에는 "교호작용 프로파일러" 보고서에 각 반응에 대한 개별 탭이 있습니다.
중첩 교호작용
예측 프로파일러 그림에 흐린 곡선을 표시하거나 숨깁니다. 흐린 곡선은 요인 범위에서 서로 다른 유형의 교호작용에 대한 프로파일러를 나타냅니다. 이 옵션을 사용하면 프로파일러에서 요인 값을 변경할 필요 없이 교호작용을 정적으로 볼 수 있습니다. 연속형 요인의 경우 지정된 요인 범위에서 균등한 간격의 요인 값에 대해 교호작용 곡선이 생성됩니다. 범주형 요인의 경우 요인의 각 수준에 대해 교호작용 곡선이 생성됩니다.
이 옵션을 선택한 경우 굵은 검은색 선은 현재 요인 값을 사용하여 계산된 프로파일러 곡선을 나타냅니다. 연한 회색 선은 "조합" 및 "확장 범위" 옵션으로 정의된 교호작용 곡선을 나타냅니다. 교호작용 곡선을 커서로 가리키면 곡선이 강조 표시되고 다른 요인 축에 해당 요인 값이 회색 눈금 표식으로 표시됩니다. 강조 표시된 곡선을 클릭하면 강조 표시된 교호작용 곡선을 생성하는 데 사용된 값과 일치하도록 요인 값이 업데이트됩니다.
중첩 교호작용 옵션
("중첩 교호작용" 옵션을 선택한 경우에만 사용 가능) 예측 프로파일러 그림에서 중첩 교호작용 곡선을 정의하는 옵션이 포함된 하위 메뉴를 표시합니다.
조합
프로파일러에 표시되는 교호작용 곡선 유형을 지정하는 옵션이 포함된 하위 메뉴를 표시합니다.
혼합
범주형 요인의 가능한 모든 조합과 한 번에 하나씩 변하는 연속형 요인의 교호작용 곡선을 그림에 표시합니다. 범주형 요인이 없으면 "이원" 옵션과 동일합니다.
이원
다른 모든 요인은 일정하게 유지되는 상태에서 각 곡선이 단일 요인의 변화에 해당하는 교호작용 곡선을 그림에 표시합니다. 이 옵션은 요인 간의 이원 교호작용을 확인하는 데 유용합니다. 이 옵션이 기본 설정입니다.
다원
다른 요인의 가능한 모든 조합에 대한 교호작용 곡선을 그림에 표시합니다.
확장 범위
각 연속형 요인의 표집 범위를 결정하는 방법을 지정하는 옵션이 포함된 하위 메뉴를 표시합니다. 각 요인의 표집 범위는 교호작용 곡선이 생성되는 가장 낮은 값과 가장 높은 값을 정의합니다. 그런 다음 요인 범위에서 균등한 간격의 요인 값에 대해 교호작용 곡선이 생성됩니다. 이때 총 교호작용 곡선 수는 "요인당 표본 수" 옵션에 정의된 값과 일치합니다.
내부 축 범위
각 요인의 범위를 요인 축 범위의 내부 80%로 정의합니다. 기본적으로 이 범위는 각 요인의 10% 분위수와 90% 분위수입니다. 확대/축소 또는 이동을 통해 요인 축이 업데이트되면 범위가 업데이트됩니다.
전체 축 범위
요인 축의 가장 낮은 값과 가장 높은 값을 사용하여 각 요인의 범위를 정의합니다. 기본적으로 이 범위는 각 요인의 가장 낮은 값과 가장 높은 값입니다. 확대/축소 또는 이동을 통해 요인 축이 업데이트되면 범위가 업데이트됩니다.
1 표준편차
각 요인의 범위를 요인 평균 +/- 1 표준편차로 정의합니다.
2 표준편차
각 요인의 범위를 요인 평균 +/- 2 표준편차로 정의합니다.
데이터 범위
데이터의 가장 낮은 요인 값과 가장 높은 요인 값을 사용하여 각 요인의 범위를 정의합니다.
요인당 표본 수
각 연속형 요인에 대해 추출되는 표본 값 수를 지정합니다. 이 표본 값은 프로파일러 그래프에 교호작용 곡선을 생성하는 데 사용됩니다. 기본값은 6입니다. "다원" 옵션을 선택한 경우 각 연속형 요인에 대해 추출되는 표본 값 수는 floor(요인당 표본 수*2/3)입니다.
데이터 점
예측 프로파일러 그림에 개별 데이터 점을 표시하거나 숨깁니다. 데이터 점은 각 프로파일러의 평면에서 떨어진 거리에 따라 흐리게 표시됩니다. 프로파일러 평면에서 멀리 떨어진 데이터 점은 프로파일러 평면에 가까운 데이터 점보다 더 밝게 표시됩니다. 이 옵션을 사용하면 데이터에서 프로파일러 곡선을 어느 정도 지지하는지 시각적으로 진단할 수 있습니다.
팁: 그림에서 점을 선택하려면 도구 모음의 브러시 도구
를 사용합니다.
신뢰 구간
예측 프로파일러 그림에 신뢰 구간을 표시하거나 숨깁니다. 구간은 범주형 요인의 경우 오차 막대이고 연속형 요인의 경우 곡선입니다. 각 예측 변수에 대한 구간을 사용하여 해당 예측 변수가 반응 예측의 신뢰도에 미치는 영향을 평가합니다. 반응에 대한 신뢰 구간은 세로 축에 파란색으로 표시됩니다. 신뢰 구간은 특정 적합 플랫폼에서 프로파일러가 사용되거나, 신뢰 구간 계산식이 데이터 테이블에 저장되거나, "예측값 표준 오차 <열 이름>" 형식의 표준 오차 열이 예측 프로파일러 시작 창의 "Y, 예측 계산식" 역할에 지정된 경우 사용할 수 있습니다.
예측 구간
예측 프로파일러 그림에 예측 구간을 표시하거나 숨깁니다. 예측 구간은 모형 추정의 변동과 잔차 오차의 변동을 모두 포함하여 계산됩니다. 구간은 범주형 요인의 경우 오차 막대이고 연속형 요인의 경우 곡선입니다. 각 예측 변수에 대한 구간을 사용하여 해당 예측 변수가 새 관측값 예측의 신뢰도에 미치는 영향을 평가합니다. 새 관측값에 대한 예측 구간은 세로 축에 녹색으로 표시됩니다. 예측 구간은 특정 적합 플랫폼에서 프로파일러가 사용되거나, 예측 구간 계산식이 데이터 테이블에 저장되는 경우 사용할 수 있습니다.
참고: 예측 구간이 신뢰 구간보다 넓습니다. 예측 구간은 모형 생성에 사용되지 않은 새 관측값을 대상으로 합니다.
오차 막대 지지선
(요인 및 반응 변수에 "시그마" 열 특성이 있는 경우 표시됨) 요인의 변동으로 인해 반응에 내재된 3s 구간을 표시하거나 숨깁니다. 구간 값도 세로 축에 녹색으로 표시됩니다. 요인 값을 잘 제어할 수 없는 경우 요인 값의 변동 측면에서 반응의 변동을 설명할 때 POE(오차 전파)가 중요합니다. 자세한 내용은 오차 막대 전파에 대한 통계 상세 정보에서 확인하십시오.
민감도 지표
높이와 방향이 현재 값에서 프로파일 함수의 편도함수 값에 해당하는 보라색 삼각형을 표시하거나 숨깁니다. 이 삼각형은 큰 프로파일에서 민감한 셀을 빠르게 찾을 수 있어 유용합니다.
그림 3.6 민감도 지표
경계에서 프로파일
혼합물 설계를 분석할 때 JMP에서 요인 범위를 제한하므로 혼합물 제약을 벗어나는 설정이 불가능합니다. 이 때문에 일부 혼합물 설계에서는 프로파일 트레이스가 갑자기 변합니다.
일반적인 0 ~ 1 제약 조건 외에 다른 제약 조건이 있는 혼합물 성분이 있으면 "예측 프로파일러"의 빨간색 삼각형 메뉴에 "경계에서 프로파일"이라는 새 하위 메뉴가 나타납니다. 다음과 같은 두 가지 옵션이 있습니다.
경계에서 변환
설정이 제약 조건의 경계를 따라 계속되도록 합니다.
경계에서 중지
엄격한 비례가 유지되는 영역으로 예측 트레이스를 절단합니다.
외삽 제어
외삽 제어 옵션이 포함된 하위 메뉴를 표시합니다. 이 기능은 가능한 외삽 예측을 식별하는 데 도움이 됩니다. 원래 데이터의 요인 공간에 없는 요인 점의 조합을 사용하여 예측하는 경우 외삽으로 간주됩니다. 외삽 제어 기능에서 점이 외삽인지 여부를 결정하는 데 사용되는 측정 기준은 모형 적합 유형에 따라 다릅니다. 모형 적합 플랫폼의 표준 최소 제곱 분석법으로 적합된 모형의 경우 요인 설정의 레버리지가 기본 외삽 측정 기준으로 사용됩니다. 다른 모든 모형의 경우 정규화 Hotelling T2 값이 기본 외삽 측정 기준으로 사용됩니다. 모든 모형에서 K 최근접 이웃 외삽 측정 기준을 사용하는 옵션이 있습니다. 자세한 내용은 외삽 제어 측정 기준에 대한 통계 상세 정보에서 확인하십시오.
외삽 제어는 최소 제곱 적합, 신경망, 나이브 베이즈, 부분 최소 제곱, 서포트 벡터 머신, 구조 방정식 모형 및 일반화 회귀 플랫폼에 포함된 프로파일러에서 사용할 수 있습니다. "그래프" 메뉴에서 시작된 프로파일러에서도 사용할 수 있습니다. 특정 플랫폼에서 외삽 제어를 사용할 수 없는 경우 예측 계산식을 데이터 테이블에 저장하고 "그래프" 메뉴에서 프로파일러를 시작할 수 있습니다. 외삽 제어 측정 기준에 사용되는 데이터는 프로파일러 유형에 따라 다릅니다.
– 검증을 사용하여 모형을 생성하는 경우 포함된 프로파일러 및 외삽 제어 측정 기준은 훈련 데이터를 기반으로 합니다.
– "그래프" 메뉴에서 프로파일러를 시작하는 경우 특정 행을 명확히 제외하지 않는 한 외삽 제어 측정 기준은 모든 데이터를 기반으로 합니다.
– 모형 적합 중 결측값을 무시하는 플랫폼에서 모형을 생성하는 경우 해당 행은 포함된 프로파일러 및 외삽 제어 측정 기준에서 제외됩니다.
– 결측값 정보화를 사용하여 모형을 생성하는 경우 포함된 프로파일러 및 외삽 제어 측정 기준에 결측값 정보화가 반영됩니다.
– "그래프" 메뉴에서 프로파일러를 시작할 때 외삽 제어 측정 기준에 결측값 정보화를 포함하려면 "결측값 정보화" 열 특성을 사용합니다.
– "그래프" 메뉴에서 시작한 프로파일러에서 외삽 제어를 호출하면 모형 적합 유형에 관계없이 정규화 Hotelling T2 값이 기본 외삽 측정 기준으로 사용됩니다. 따라서 표준 최소 제곱 플랫폼에 포함된 프로파일러의 외삽 제어 결과가 그래프 메뉴 프로파일러의 결과와 일치하지 않을 수 있습니다.
외삽 제어 메뉴에는 외삽 가능성을 경고하거나, 외삽 예측이 표시되지 않도록 요인 설정을 제한하는 옵션이 포함되어 있습니다.
끄기
모든 외삽 제어 및 경고를 해제합니다.
켜기
외삽 제어를 설정합니다. 이 옵션을 선택하면 프로파일러 상단에 표시되고 프로파일 트레이스는 외삽을 방지하는 요인 조합으로 제한됩니다.
경고 설정
외삽 경고를 설정합니다. 이 옵션을 선택하면 프로파일러 상단에 표시됩니다. 선택한 요인 조합이 외삽을 생성하는 경우 "--외삽 가능--"이라는 경고가 나타납니다.
외삽 유형 옵션
사용할 외삽 측정 기준을 선택할 수 있는 하위 메뉴를 제공합니다. 모형 적합 플랫폼의 표준 최소 제곱 분석법으로 적합된 모형의 경우 옵션은 "레버리지" 및 "K 최근접 이웃"입니다. 다른 모든 모형의 경우 옵션은 "정규화된 T2" 및 "K 최근접 이웃"입니다. 자세한 내용은 외삽 제어 측정 기준에 대한 통계 상세 정보에서 확인하십시오.
외삽 상세 정보
예측 프로파일러 위에 외삽 제어 상세 정보를 표시하거나 숨깁니다. 외삽 제어 상세 정보에는 현재 점의 외삽 측정 기준 값, 외삽 임계값, 외삽 측정 기준 유형 및 외삽 임계 정의가 포함됩니다.
임계값 기준 설정
외삽 임계값을 조정할 수 있는 창을 엽니다. 외삽 측정 기준이 요인 설정의 레버리지인 경우 레버리지 계산 방법과 해당 승수 값을 지정할 수 있습니다. 외삽 측정 기준이 정규화 Hotelling T2 값인 경우 승수를 지정할 수 있습니다. 자세한 내용은 외삽 제어 측정 기준에 대한 통계 상세 정보에서 확인하십시오.
참고:K 최근접 이웃 외삽 측정 기준에는 이 옵션을 사용할 수 없습니다.
요인 격자 재설정
각 요인에 대해 요인의 현재 설정에 대한 특정 값을 입력하고, 해당 설정을 잠그거나, 격자의 여러 요소를 제어할 수 있는 창을 표시합니다. 자세한 내용은 요인 값 설정 또는 잠금 섹션에서 확인하십시오.
그림 3.7 요인 설정 창
요인 설정
다음 옵션으로 구성된 하위 메뉴입니다.
설정 기억
"설정 기억" 명령이 호출될 때마다 현재 설정 값을 누적하는 개요 노드를 보고서에 추가합니다. 기억된 각 설정 앞에는 해당 설정으로 재설정하는 데 사용되는 라디오 버튼이 있습니다. "기억된 설정"의 빨간색 삼각형 메뉴에는 선택한 설정 또는 모든 설정을 제거하는 옵션이 있습니다. 저장된 설정의 이름도 사용자 정의할 수 있습니다.
참고:변수 선택을 수행하는 모형 적합 플랫폼에서 프로파일러를 시작하는 경우 이 옵션은 모형에 포함되지 않은 요인에 결측값을 할당합니다.
행의 데이터로 설정
데이터 테이블 행의 값을 예측 프로파일러의 X 변수에 할당합니다.
설정 스크립트 복사
현재 예측 프로파일러 설정을 클립보드에 복사합니다.
설정 스크립트 붙여넣기
클립보드의 예측 프로파일러 설정을 다른 보고서의 예측 프로파일러에 붙여 넣습니다.
테이블에 설정 추가
현재 프로파일러 설정을 데이터 테이블의 끝에 추가합니다. 이 옵션은 예측 프로파일러에 다른 런을 실행하기 위해 실험에 추가할 설정 조합이 있는 경우에 유용합니다.
참고:변수 선택을 수행하는 모형 적합 플랫폼에서 프로파일러를 시작하는 경우 이 옵션은 모형에 포함되지 않은 요인에 결측값을 할당합니다.
요인 설정 브로드캐스트
현재 프로파일러의 요인 설정을 다른 모든 프로파일러로 보내고 프로파일러를 연결하지 않습니다. "요인 설정 브로드캐스트"를 다시 선택하지 않으면 한 프로파일러에서 요인을 변경해도 다른 프로파일러에서 변경되지 않습니다.
프로파일러 연결
모든 프로파일러를 함께 연결합니다. 한 프로파일러에서 요인을 변경하면 표면 그림을 포함하여 다른 모든 프로파일러에서 요인이 해당 값으로 변경됩니다. 이는 모든 프로파일러에 대해 설정되거나 설정되지 않는 전역 옵션입니다.
스크립트 설정
요인이 변경될 때마다 호출되는 스크립트를 설정합니다. 설정된 스크립트는 다음 형식의 인수 목록을 받습니다.
{factor1 = n1, factor2 = n2, ...}예를 들어 이 목록을 로그에 기록하려면 먼저 다음 함수를 정의합니다.
ProfileCallbackLog = Function({arg},show(arg));그런 다음 "스크립트 설정" 대화상자에 ProfileCallbackLog를 입력합니다.
이와 비슷한 다음 함수는 요인 값을 전역 값으로 변환합니다.
ProfileCallbackAssign = Function({arg},evalList(arg));또는 다음과 같이 한 번에 하나씩 값에 액세스합니다.
ProfileCallbackAccess = Function({arg},f1=arg["factor1"];f2=arg["factor2"]);언스레드
멀티스레딩이 작동하지 않을 경우 언스레드 분석으로 변경할 수 있습니다.
애니메이션
다양한 요인 설정을 쉽게 순환할 수 있는 애니메이션 컨트롤을 표시하거나 숨깁니다. 자세한 내용은 애니메이션 컨트롤에서 확인하십시오.
기본 수준 수
각 연속형 요인에 대한 기본 수준 수를 설정할 수 있습니다. 이 옵션은 예측 프로파일러가 특히 클 때 유용합니다. 트레이스를 처음 계산할 때 JMP는 소요 시간을 측정합니다. 이 시간이 3초를 초과하는 경우 기본 수준 수를 줄이면 계산 속도가 빨라진다는 경고가 표시됩니다. 기본 수준 수 최대값은 1000입니다.
격자 테이블 생성
요인에 대해 격자 값을 포함하는 열, 각 반응에 대해 각 격자 점에서 계산된 값 및 각 격자 점의 만족도 계산을 포함하는 열이 있는 새 데이터 테이블을 생성합니다. 요인 또는 반응에 규격 한계가 있는 경우 행이 규격 한계 내에 있는지 여부를 나타내는 열이 있습니다. 신뢰 구간 및 예측 구간을 지원하는 플랫폼에서 예측 프로파일러를 시작하는 경우 이러한 구간도 데이터 테이블의 열로 포함됩니다. 새 데이터 테이블에는 요인 또는 반응의 규격 내 영역을 시각화하는 데 사용할 수 있는 스크립트가 포함되어 있습니다.
요인이 많은 경우 격자 테이블에 대한 메모리 할당 메시지가 표시될 수 있습니다. 이 경우 격자 테이블에서 잠긴 상수 값으로 유지되도록 일부 요인을 잠글 수 있습니다. 잠긴 열을 지정하려면 Alt 키 또는 Option 키를 누른 채 프로파일러 그래프 내부를 클릭하여 "요인 설정 잠금" 체크박스가 있는 창을 표시합니다.
랜덤 테이블 생성
랜덤 요인 설정 및 해당 설정의 예측값이 포함된 데이터 테이블을 생성합니다. 요인 또는 반응에 규격 한계가 있는 경우 행이 규격 한계 내에 있는지 여부를 나타내는 열이 있습니다. 신뢰 구간 및 예측 구간을 지원하는 플랫폼에서 예측 프로파일러를 시작하는 경우 이러한 구간도 데이터 테이블의 열로 포함됩니다. 새 데이터 테이블에는 요인 또는 반응의 규격 내 영역을 시각화하는 데 사용할 수 있는 스크립트가 포함되어 있습니다.
"랜덤 테이블 생성" 옵션을 선택하면 런 수를 지정하는 대화상자가 나타납니다. 지정된 표준편차 값을 사용하여 하나 이상의 반응에 랜덤 잡음을 추가하는 옵션도 있습니다. 이 옵션은 평균 0과 지정된 표준편차를 사용하는 정규 랜덤 값을 예측 반응에 추가합니다. 반응 열에 표준편차 값을 포함하는 "예측" 열 특성이 있는 경우 표준편차 값에 열 특성의 값이 자동으로 채워집니다.
이 옵션은 시뮬레이터를 열고 모든 요인을 균등 난수 분포로 재설정한 후 반응을 시뮬레이션(랜덤 잡음 추가 또는 추가 안 함)하는 것과 같으며 더 간단합니다.
균등 난수 요인 테이블을 생성하는 주된 이유는 그래픽 쿼리를 사용하여 다변량 방식으로 요인 공간을 탐색하기 위해서입니다. 이 기법을 필터링된 몬테카를로라고 합니다.
원하는 반응 설정에 대한 특정 범위를 생성하는 모든 요인 설정을 확인하려는 경우를 가정해 보겠습니다. 그래픽 브러시 또는 데이터 필터를 사용하여 적합하지 않은 점을 선택하고 숨기면 남은 가능성, 즉 원하는 결과를 생성하는 기회 공간을 볼 수 있습니다.
일부 행은 선택되어 빨간색 점으로 표시될 수 있습니다. 이는 다변량 만족도 파레토 프론티어의 점, 즉 모든 요인의 만족도와 관련하여 다른 점에 의해 지배되지 않는 점을 나타냅니다. 선택된 행은 "지배적" 열에서 값이 1인 행에 해당합니다.
Shapley 값
Shapley 값을 계산하는 옵션이 포함된 하위 메뉴입니다. Shapley 값은 모형의 개별 예측을 설명합니다. 각 독립 변수 xj에 대해 Shapley 값 벡터 fj가 계산되어 각 개별 예측에 대한 값이 생성됩니다. 이러한 값은 백그라운드 데이터 집합에 대한 모형 적합의 평균 예측과 비교하여 예측에 대한 독립 변수의 기여도를 제공합니다. Shapley 값은 가법적이며 각 예측은 Shapley 값과 평균 예측의 합으로 작성할 수 있습니다. 평균 예측을 Shapley 절편이라고 합니다. Shapley 값에 대한 자세한 내용은 Shapley(1953) 및 Lundberg & Lee(2017)에서 확인하십시오.
프로파일러는 순열 SHAP 방법을 사용하여 Shapley 값을 계산합니다. 자세한 내용은 Lundberg(2018)에서 확인하십시오.
Shapley 값 저장
예측 모형의 각 독립 변수에 대한 새 열을 원래 데이터 테이블에 추가합니다. 각 새 열에는 해당 요인에 대해 현재 추정 옵션 설정을 사용하여 계산된 Shapley 값이 포함됩니다. Shapley 절편에 대한 숨겨진 열도 있습니다. 기본적으로 Shapley 값은 데이터 테이블에서 제외된 행에 대해 계산되지 않습니다.
Shapley 값 옵션 설정
Shapley 값 계산을 위한 옵션을 지정할 수 있는 창을 엽니다.
백그라운드 데이터 선택
Shapley 값 계산에 사용되는 백그라운드 데이터의 양을 지정합니다. 훈련 데이터의 백분율 또는 훈련 데이터의 특정 행 수를 지정할 수 있습니다. 기본적으로 Shapley 값 계산에는 모든 훈련 데이터가 사용됩니다.
Shapley 추정 방법 옵션
순열 SHAP에 사용되는 순열 수를 지정하고 재현을 위해 난수 시드값을 설정하는 옵션을 제공합니다. 기본적으로 순열 수는 10입니다.
제외된 행을 포함하여 모든 행에 대한 Shapley 값을 계산하는 옵션이 있습니다. Shapley 값 그래프를 생성하는 스크립트를 데이터 테이블에 추가하는 옵션도 있습니다. 각 반응 변수에 대해 스크립트가 추가됩니다.
확인을 클릭하면 옵션 설정이 저장됩니다. 확인 및 실행을 클릭하면 옵션 설정이 저장되고 Shapley 값을 계산합니다.
선형 제약 조건 변경
선형 제약 조건을 추가, 변경 또는 삭제할 수 있습니다. 제약 조건은 프로파일러의 동작에 통합됩니다. 각 연속형 요인에 대한 한계를 보고 변경할 수도 있습니다. 자세한 내용은 선형 제약 조건에서 확인하십시오.
선형 제약 조건 저장
기존 선형 제약 조건을 "제약 조건" 테이블 스크립트에 저장할 수 있습니다. 자세한 내용은 선형 제약 조건에서 확인하십시오.
조건부 예측
모형에 임의 효과가 포함된 경우 나타납니다. 임의 효과 예측은 예측값과 프로파일을 구성하는 데 사용됩니다.
모양
다음 옵션으로 구성된 하위 메뉴입니다.
행으로 배열
한 행에 표시할 그림의 개수를 입력합니다. 이 옵션을 사용하면 여러 그림을 하나의 넓은 행으로 표시하지 않고 세로로 표시할 수 있습니다.
참고:행에 표시할 기본 그림 수를 설정하려면 파일 > 환경 설정 > 플랫폼 > 프로파일러로 이동하여 "행으로 배열" 환경 설정을 편집합니다.
그래프 간격
그래프 패널 사이의 가로 간격 크기를 설정할 수 있는 창을 엽니다.
X 변수 재정렬
모형 주효과를 원하는 순서로 드래그하여 재정렬할 수 있는 창을 엽니다.
Y 변수 재정렬
반응을 원하는 순서로 드래그하여 재정렬할 수 있는 창을 엽니다.
Y 변수 숨기기
(연속형 반응에만 사용 가능) 프로파일러에서 표시하거나 숨길 반응 변수를 지정합니다.
Y 축 조정
반응이 축 범위를 벗어나는 경우 반응 범위가 포함되도록 세로 축의 척도를 조정합니다.
생성자 표시
계산식을 생성한 플랫폼의 이름을 반응 열에 표시하거나 숨깁니다. 플랫폼 이름이 세로 축에 나타납니다. 반응 열의 "예측" 열 특성에 "Creator"라는 인수가 포함된 경우에만 사용할 수 있습니다.
그림 3.8 애니메이션 컨트롤
재생/일시 중지
프로파일러에 애니메이션을 적용하려면 재생을 누릅니다. 요인 설정을 순환하고 순환이 완료되면 처음으로 되돌립니다. 애니메이션을 중지하려면 일시 중지를 누릅니다.
순환 유형
요인 설정에 대한 순환 유형을 나열합니다.
순차
각 요인의 값을 한 요인씩 차례로 순환합니다. 애니메이션이 현재 순환 중인 요인의 이름이 속도 슬라이더 막대 옆에 표시됩니다.
단일 요인
다른 모든 요인은 일정하게 유지하고 선택한 요인의 값을 순환합니다. 선택한 요인의 이름이 속도 슬라이더 막대 옆에 표시됩니다.
랜덤
요인 설정/값의 다양한 조합을 무작위로 순환합니다.
순차 데이터
요인 값을 한 번에 한 행씩 데이터 테이블의 행으로 설정합니다(1행부터 시작). 현재 요인 설정의 행 번호가 속도 슬라이더 막대 옆에 표시됩니다.
랜덤 데이터
요인 값을 한 번에 한 행씩 데이터 테이블의 랜덤 행으로 설정합니다. 현재 요인화 설정의 행 번호가 속도 슬라이더 막대 옆에 표시됩니다.
속도 슬라이더 막대
슬라이더 막대를 사용하여 애니메이션 속도를 조정합니다.