이 예에서는 작은 데이터 테이블에 부분 가중치(베이지안 붓스트랩) 옵션을 사용할 경우의 이점을 보여 줍니다. 데이터는 7가지 토양 유형을 각각 포함하는 세 개의 표본에서 측정된 반응(Y)으로 구성되어 있습니다. 한 과학자가 wabash 토양 유형의 평균 반응에 대한 신뢰 구간을 구하려고 합니다.
각 토양 유형마다 관측값이 세 개씩만 있으므로 단순 붓스트랩을 수행하면 wabash의 관측값 세 개가 모두 붓스트랩 표본에서 제외될 가능성이 있습니다. 부분 가중치 옵션을 사용하면 모든 붓스트랩 표본에서 각 토양 유형의 모든 관측값을 나타낼 수 있습니다.
이 과학자는 다음과 같은 두 가지 붓스트랩 방법을 모두 사용하여 wabash 표본 평균의 분포를 확인합니다.
1. 도움말 > 샘플 데이터 폴더를 선택하고 Snapdragon.jmp를 엽니다.
2. 분석 > X로 Y 적합을 선택합니다.
3. Y를 선택하고 Y, 반응을 클릭합니다.
4. Soil을 선택하고 X, 요인을 클릭합니다.
5. 확인을 클릭합니다.
6. "Y 대 Soil의 일원 분석" 옆의 빨간색 삼각형을 클릭하고 평균/ANOVA를 선택합니다.
7. 일원 ANOVA에 대한 평균 보고서에서 평균 열을 마우스 오른쪽 버튼으로 클릭하고 붓스트랩을 선택합니다.
8. 붓스트랩 표본 수에 1000을 입력합니다.
9. (선택 사항) Figure 11.7의 결과와 매칭되는 결과를 얻으려면 난수 시드값에 12345를 입력합니다.
10. 확인을 클릭합니다.
그림 11.7 단순 붓스트랩에 대한 붓스트랩 결과
Figure 11.7의 결측값은 해당 붓스트랩 표본에 주어진 토양 유형의 관측값이 모두 선택되지 않은 붓스트랩 반복을 나타냅니다.
11. 분석 > 분포를 선택합니다.
12. wabash를 선택하고 Y, 열을 클릭합니다.
13. 확인을 클릭합니다.
그림 11.8 단순 붓스트랩으로 구한 wabash 평균의 분포
Figure 11.8에서는 단순 붓스트랩 분석으로 구한 wabash 평균의 분포를 보여 줍니다. 다음 사항에 유의하십시오.
– "요약 통계량" 보고서는 wabash에 대한 붓스트랩 평균을 포함하는 행의 개수가 N = 961임을 나타냅니다. 1,000회 반복을 수행했지만 39개의 붓스트랩 표본에는 wabash에 대한 세 개의 관측값이 전혀 포함되지 않았습니다.
– 표본 평균 히스토그램은 평활하지 않고 두 개의 극단값에서 정상점을 보여 줍니다. wabash에 대한 세 개의 값은 38.2, 37.8 및 31.9입니다. 분포의 낮은 쪽 정상점은 붓스트랩 표본에 값 31.9만 포함되어서 발생한 경우이고, 높은 쪽 정상점은 붓스트랩 표본에 값 38.2와 37.8이 하나 또는 모두 포함되어서 발생한 경우입니다.
다음으로는 부분 가중치(베이지안 붓스트랩) 옵션을 사용하여 붓스트랩 표본에서 결측값이 발생하지 않도록 하고 붓스트랩 평균의 분포를 평활화합니다.
1. "일원 분석" 보고서에서 일원 ANOVA에 대한 평균 보고서의 평균 열을 마우스 오른쪽 버튼으로 클릭하고 붓스트랩을 선택합니다.
2. 붓스트랩 표본 수에 1000을 입력합니다.
3. (선택 사항) Figure 11.9의 결과와 매칭되는 결과를 얻으려면 난수 시드값에 12345를 입력합니다.
4. 부분 가중치 옵션을 선택합니다.
5. 확인을 클릭합니다.
그림 11.9 베이지안 붓스트랩에 대한 붓스트랩 결과
베이지안 붓스트랩 결과 테이블에 결측값이 없습니다. Snapdragon.jmp 데이터 테이블의 21개 행이 모두 포함되었으며 각 붓스트랩 표본에서 붓스트랩 가중치만 달라졌습니다.
6. 분석 > 분포를 선택합니다.
7. wabash를 선택하고 Y, 열을 클릭합니다.
8. 확인을 클릭합니다.
그림 11.10 베이지안 붓스트랩으로 구한 wabash 평균의 분포
베이지안 붓스트랩은 wabash 표본 평균에 대해 훨씬 더 평활한 분포를 생성합니다. 1,000개의 붓스트랩 표본 모두에 wabash에 대한 세 개의 관측값이 포함되어 있습니다. 각 반복 시마다 서로 다른 부분 가중치를 사용하여 wabash 표본 평균이 계산됩니다.
"붓스트랩 신뢰 한계" 보고서에는 평균에 대한 95% 신뢰 구간이 32.6396 ~ 37.8168로 나타납니다.