발행일 : 03/10/2025

혼합 적합

수명 분포 플랫폼의 "혼합 적합" 옵션은 "혼합" 개요를 보고서에 추가합니다. "혼합" 개요에서 혼합 분포를 데이터에 적합시킬 수 있습니다. 예는 혼합 분포 적합의 예에서 확인하십시오.

혼합 분포의 확률 함수 F(x)는 다음과 같이 정의됩니다.

Equation shown here

여기서 Fi(x)는 지원되는 분포 중 하나, k는 혼합 성분의 수, wi는 합이 1이 되는 양수 가중치입니다. "혼합 적합" 옵션은 각 성분 분포인 Fi(x)에서 추출되는 관측값 군집을 식별하려고 합니다. 혼합물의 모수 및 주어진 성분에서 관측값이 추출될 확률을 추정합니다.

모형 적합 및 혼합 시작 값 방법

적합 방법론은 시작 값 방법이라고 하는 기본 군집에 대한 가정을 기반으로 합니다. k개의 분포를 지정한다고 가정해 보겠습니다. 다음과 같은 세 가지 시작 값 방법이 있습니다.

단일 군집에서는 모든 관측값이 모든 성분 분포의 영향을 어느 정도 받는다고 가정합니다. 관측값의 일부에만 영향을 미치는 것으로 나타나는 밀도는 없습니다.

분리 가능 군집에서는 성분 분포가 일부 관측값에 더 크게 영향을 준다고 가정합니다. 분리 가능 군집의 경우 k개의 각 밀도는 식별 가능한 최빈값을 가지며 군집을 정의합니다.

중첩 군집에서는 단일 군집과 분리 가능 군집 사이의 중간 상황을 가정합니다. 일부 밀도는 눈에 띄지만 다른 밀도는 관측값 일부에 공동으로 영향을 미칩니다. 이 경우 데이터에는 m개의 군집이 있으며, 여기서 m은 총 밀도 수인 k보다 작습니다.

적합 프로세스는 다음 단계로 구성됩니다.

1. 관측값 군집이 정의됩니다.

2. 시작 값 방법을 기반으로 밀도에 군집이 할당됩니다.

분리 가능 군집의 경우 가능한 순열을 검토하여 지정된 성분 밀도에 군집의 가장 큰 가능도 할당이 결정됩니다.

중첩 군집의 경우 군집의 가능한 순열과 관측값 조합을 검토하여 지정된 성분 밀도에 군집의 가장 큰 가능도 할당이 결정됩니다.

참고: 주어진 시작 값 방법을 사용하여 모형을 적합시킨 후 다른 시작 값 방법을 선택한다고 가정해 보겠습니다. 가능도 값을 기반으로 더 나은 적합을 얻을 수 없으면 새 모형이 추가되지 않습니다.

혼합 제어판

제어판은 다음 항목으로 구성됩니다.

성분

적합 혼합 분포의 성분으로 사용할 수 있는 분포를 나열합니다.

수량

혼합 분포에서 주어진 분포를 갖는 성분 수를 선택합니다. "수량" 값의 합은 혼합의 밀도 수인 k입니다.

시작 값 방법

혼합에 대한 가정을 반영하는 방법을 선택합니다. 자세한 내용은 모형 적합 및 혼합 시작 값 방법에서 확인하십시오.

중첩

중도절단되지 않은 데이터 값에 대한 비모수 추정값(Kaplan-Meier-Turnbull)을 표시합니다. 혼합을 적합시키면 그림이 업데이트되어 모형과 95% 수준 신뢰 대역을 표시합니다. 이러한 대역에 대한 신뢰 수준은 "수명 분포"의 빨간색 삼각형 메뉴에 있는 "신뢰 수준 변경" 옵션으로 결정됩니다. 그림 오른쪽에 범례가 나타납니다.

시작

원하는 혼합을 적합시키려면 시작을 클릭합니다. 적합시킨 모형으로 모형 목록이 없데이트되고 혼합 모형 이름이 포함된 보고서가 추가됩니다.

혼합 적합 보고서

모형 목록

"모형 목록" 보고서에는 적합시킨 혼합 분포가 나열됩니다. 이 보고서는 각 혼합 분포에 대한 모수 수, 실제 관측값 수, AICc, -2*로그 가능도 및 BIC 통계량을 제공합니다. 이러한 통계량에 대한 자세한 내용은 선형 모형 적합가능도, AICc 및 BIC에서 확인하십시오.

다음 사항에 유의하십시오.

이러한 각 통계량의 값이 작을수록 더 나은 적합을 나타냅니다.

AICc를 기준으로 행이 정렬됩니다.

비교 기준 빨간색 삼각형 옵션은 "모형 목록"의 모형 순서에 영향을 주지 않습니다.

AICc, -2*로그 가능도 및 BIC 통계량은 "모형 비교" 테이블에도 나타납니다. 이를 통해 혼합 분포를 데이터의 다른 분포와 비교할 수 있습니다. 자세한 내용은 모형 비교에서 확인하십시오.

혼합 보고서

"모형 목록" 보고서 다음에는 적합시킨 각 혼합 분포에 대한 보고서가 나옵니다. 각 보고서의 제목은 지정된 성분과 수량을 사용하여 해당 혼합을 설명합니다. 이 보고서에는 모수, 추정값, 표준 오차 및 95% Wald 신뢰 구간이 나열됩니다. 이러한 구간은 시작 창에서 가능도 신뢰 구간 방법을 선택하더라도 영향을 받지 않습니다.

혼합의 각 분포에 대한 모수 추정값이 제공됩니다. "모수" 열에는 "부분 <i>"라는 모수도 포함되며, 여기서 i = 1, 2,..., k-1입니다. 이러한 값은 혼합에 대한 가중치 wi의 추정값입니다. 가중치 합은 1이므로 처음 k - 1개의 가중치에서 k번째 가중치를 계산할 수 있습니다.

밀도 중첩 그림

"밀도 중첩" 그림에는 각 혼합 성분에 대한 밀도 함수의 추정값이 표시됩니다. 그림 오른쪽의 범례를 사용하여 표시할 밀도 함수를 선택할 수 있습니다.

혼합 보고서 옵션

빨간색 삼각형 메뉴에는 다음 옵션이 포함되어 있습니다.

제거

모형 보고서 및 "모형 목록"의 모형 항목을 제거합니다.

프로파일러 표시

결합된 혼합 분포 F에 대한 네 가지 유형의 프로파일러를 표시합니다. 빨간색 삼각형 옵션에 대한 설명은 혼합물 프로파일러 옵션에서 확인하십시오.

분포 프로파일러는 누적 고장 확률을 시간의 함수로 표시합니다.

분위수 프로파일러는 고장 시간을 누적 확률의 함수로 표시합니다.

위험 프로파일러는 위험률을 시간의 함수로 표시합니다.

밀도 프로파일러는 분포에 대한 밀도 함수를 표시합니다.

예측 저장

각 혼합 밀도에 대해 관측값이 해당 밀도에 속할 확률을 포함하는 열을 데이터 테이블에 저장합니다. 계산에 사용되는 계산식은 혼합 적합의 예측 계산식 저장에서 확인하십시오.

혼합물 프로파일러 옵션

각 혼합 보고서의 프로파일러에는 다음과 같은 빨간색 삼각형 옵션이 포함되어 있습니다.

신뢰 구간

분포, 분위수 및 위험 프로파일러에서는 표시된 함수에 대한 95% Wald 기반 신뢰 곡선을 보여 줍니다. 이 옵션은 신뢰 곡선을 표시하거나 숨깁니다. 이러한 곡선에 대한 신뢰 수준은 "수명 분포"의 빨간색 삼각형 메뉴에 있는 "신뢰 수준 변경" 옵션으로 결정됩니다.

참고: 시작 창에서 가능도 신뢰 구간 방법을 선택한 경우에도 프로파일러에 제공된 신뢰 구간은 계산 시간을 줄이기 위해 Wald 방법을 기반으로 합니다.

요인 격자 재설정

요인의 현재 설정에 대한 특정 값을 입력하고, 해당 설정을 잠그거나, 격자의 여러 요소를 제어할 수 있도록 각 요인에 대한 창을 표시합니다. 자세한 내용은 프로파일러요인 격자 재설정에서 확인하십시오.

요인 설정

프로파일러 설정, 스크립트 및 프로파일러 연결과 관련된 옵션을 포함하는 메뉴를 제공합니다. 자세한 내용은 프로파일러요인 설정에서 확인하십시오.

더 많은 정보를 원하십니까? 질문이 있습니까? JMP 사용자 커뮤니티에서 답변 받기 (community.jmp.com).