부분 최소 제곱 플랫폼을 사용하여 발트해의 해수 표본에 존재하는 세 가지 오염 화합물의 양을 예측하기 위한 모형을 생성합니다. 세 가지 관심 화합물은 다음과 같습니다.
• 리그닌술포산염 - 펄프 산업 공해
• 부식산 - 천연 임산물
• 세제의 형광 표백제
예측 변수는 v1 ~ v27의 파장 범위로 측정된 스펙트럼 방출 강도입니다. 이 예는 부분 최소 제곱이 매우 효과적인 분광계 보정 분야에서 가져왔습니다.
모형 보정을 위해 화학적 조성이 알려진 표본을 사용합니다. 보정 데이터는 농도가 알려진 리그닌술포산염, 부식산 및 세제의 16개 표본으로 구성됩니다. 27개의 등거리 파장에서 방출 강도가 기록됩니다.
1. 도움말 > 샘플 데이터 폴더를 선택하고 Baltic.jmp를 엽니다.
참고: Baltic.jmp 데이터 테이블의 데이터는 Umetrics(1995)에 보고되어 있습니다. 원본 출처는 Lindberg, Persson 및 Wold(1983) 연구 자료입니다.
2. 분석 > 다변량 방법 > 부분 최소 제곱을 선택합니다.
3. ls, ha 및 dt를 Y, 반응 역할에 할당합니다.
4. 27개의 강도 변수(v1 ~ v27)가 포함된 Intensities를 X, 요인 역할에 할당합니다.
5. 확인을 클릭합니다.
부분 최소 제곱 모형 시작 제어판이 나타납니다.
6. "검증 방법"에서 Leave-One-Out을 선택합니다.
7. 시작을 클릭합니다.
van der Voet 검정은 난수화 검정이므로 "Prob > van der Voet T2" 값이 약간 다를 수 있습니다.
그림 6.2 부분 최소 제곱 보고서
"제곱근 평균 PRESS(예측 잔차 제곱합) 그림"에서는 요인 수가 7일 때 제곱근 평균 PRESS가 최소화된다는 것을 보여 줍니다. 이 내용은 "제곱근 평균 PRESS 그림" 아래의 "참고"에 명시되어 있습니다. 7개의 요인을 사용한 NIPALS 적합(빠른 SVD 사용) 보고서가 생성되었습니다. Figure 6.3에 보고서의 일부가 표시되어 있습니다.
van der Voet T2 검정 통계량은 요인 수가 다른 모형이 최소 PRESS 값을 가진 모형과 유의하게 다른지 여부를 확인하는 데 사용됩니다. 일반적인 방법은 van der Voet 유의 수준이 0.10을 초과하는 가장 작은 수의 요인을 추출하는 것입니다(SAS Institute Inc 2023f, Tobias 1995 참조). 이 방법을 여기에 적용하려면 모형 시작 패널의 요인 수에 6을 입력하여 새 모형을 적합시킵니다.
그림 6.3 추출된 7개 요인
8. "7개의 요인을 사용한 NIPALS 적합(빠른 SVD 사용)"의 빨간색 삼각형을 클릭하고 진단 그림을 선택합니다.
그러면 실제값 대 예측값 그림을 보여 주는 보고서와 다양한 잔차 그림을 보여 주는 세 개의 보고서가 제공됩니다. "실제값 대 예측값 그림"에서는 예측 화합물 양이 실제 양과 일치하는 정도를 보여 줍니다.
그림 6.4 진단 그림
9. "7개의 요인을 사용한 NIPALS 적합(빠른 SVD 사용)"의 빨간색 삼각형을 클릭하고 VIP 대 계수 그림을 선택합니다.
그림 6.5 VIP 대 계수 그림
VIP 대 계수 그림은 다양한 반응의 적합도와 관련하여 영향력 있는 변수를 식별하는 데 도움이 됩니다. 예를 들어 v23, v2 및 v26은 모두 VIP(Variable Importance for Projection) 값이 0.8을 초과하고 계수도 상대적으로 큽니다.