기본 분석 > 시뮬레이션 > 시뮬레이션 기능의 추가 예 > 일반화 회귀에서 요인 유지의 예
발행일 : 03/10/2025

Image shown here일반화 회귀에서 요인 유지의 예

이 예에서는 일반화 회귀 모형을 구성하고 활성 모수를 사용하여 축소 모형을 적합시킵니다. 이 축소 모형을 기반으로 시뮬레이션 기능을 사용하여 요인 중 하나가 모형에 포함될 가능성을 탐색합니다.

한 제약 회사가 정제의 체내 용해도와 용해도에 영향을 미칠 수 있는 다양한 요인에 관한 과거 정보를 갖고 있다고 가정합니다. 용해도가 70 미만인 정제는 결함이 있는 것으로 간주됩니다. 따라서 용해도에 영향을 미치는 요인을 파악하려고 합니다.

모형 적합

이 섹션에서는 일반화 회귀를 사용하여 모형을 적합시킵니다.

팁: 이 섹션의 단계를 거치지 않으려면 Tablet Production.jmp 데이터 테이블의 Generalized Regression 스크립트 옆에 있는 녹색 삼각형을 클릭하여 모형을 구하십시오.

1. 도움말 > 샘플 데이터 폴더를 선택하고 Tablet Production.jmp를 엽니다.

2. 분석 > 모형 적합을 선택합니다.

3. Dissolution을 클릭하고 Y를 클릭합니다.

4. Mill Time부터 Atomizer Pressure까지 선택하고 추가를 클릭합니다.

5. "분석법" 목록에서 일반화 회귀를 선택합니다.

6. 실행을 클릭합니다.

7. "모형 시작" 패널에서 적응형 상자를 선택합니다.

8. "모형 시작" 패널에서 시작을 클릭합니다.

그림 10.13 적응형 Lasso 회귀 기반의 모형 

Model Based on Adaptive Lasso

"AICc 검증을 사용한 정규 적응형 Lasso 회귀" 보고서에 표시된 모수 추정값에 관심이 있습니다. 0이 아닌 모수 추정값에 따라 이 모형은 Mill Time, Screen Size, Blend Time, Blend Speed, Compressor, Coating ViscositySpray RateDissolution과 관련이 있음을 나타냅니다.

모형 축소

모형을 축소하기 전에 Tablet Production.jmp 데이터 테이블에 선택된 열이 없는지 확인하십시오. 선택된 열은 아래의 첫 번째 단계에서 선택 취소되지 않습니다. 선택된 열이 없도록 하면 0인 항이 있는 열이 실수로 포함되는 경우를 방지할 수 있습니다.

이 섹션의 단계를 거치지 않으려면 Tablet Production.jmp 데이터 테이블의 Generalized Regression Reduced Model 스크립트 옆에 있는 녹색 삼각형을 클릭하여 축소 모형을 구하십시오.

1. "AICc 검증을 사용한 정규 적응형 Lasso 회귀" 옆의 빨간색 삼각형을 클릭하고 활성 집합 다시 시작 > 활성 효과를 사용하여 다시 시작을 선택합니다.

이렇게 하면 "모수 추정값" 보고서에서 0이 아닌 계수 추정값이 있는 항이 "모형 효과 생성" 목록에 포함됩니다. 반응은 Y로 입력되며, "일반화 회귀" 분석법이 선택됩니다.

2. 실행을 클릭합니다.

3. "모형 시작" 패널에서 적응형 상자를 선택합니다.

4. "모형 시작" 패널에서 시작을 클릭합니다.

그림 10.14 적응형 Lasso 회귀를 사용한 축소 모형 

Reduced Model Using Adaptive Lasso

Blend Speed 추정값의 신뢰 구간(95% 하한)은 0을 포함하는 것과 매우 가깝습니다. 다음으로는 시뮬레이션 연구를 수행하여 용해도 분포에서 다른 데이터 값이 관측될 때 Blend Speed가 얼마나 자주 모형에 포함되는지 알아봅니다.

모형의 Blend Speed 포함 여부 탐색

아래 단계에서는 축소 모형에 대한 보고서(Figure 10.14)를 사용합니다.

1. "AICc 검증을 사용한 정규 적응형 Lasso 회귀" 옆의 빨간색 삼각형을 클릭하고 열 저장 > 시뮬레이션 계산식 저장을 선택합니다.

이렇게 하면 Dissolution 시뮬레이션 계산식이라는 새 열이 Tablet Production.jmp 데이터 테이블에 추가됩니다.

2. (선택 사항) 데이터 테이블의 "열" 패널에서 Dissolution 시뮬레이션 계산식의 오른쪽에 있는 더하기 기호를 클릭합니다.

그림 10.15 시뮬레이션 계산식 

Simulation Formula

이 계산식은 각 행에 대해서 주어진 모형과 Dissolution의 분포(표준편차가 약 1.998인 정규 분포로 추정)로 구할 수 있는 값을 시뮬레이션합니다.

3. 취소를 클릭합니다.

4. 축소 모형 보고서 창으로 돌아갑니다. "원래 예측 변수에 대한 모수 추정값" 보고서에서 "추정값" 열을 마우스 오른쪽 버튼으로 클릭하고 시뮬레이션을 선택합니다.

"스위치 아웃할 열" 목록에 Dissolution이 선택되어 있는지 확인합니다.

5. 표본 수 옆에 300을 입력합니다.

이 시뮬레이션에서는 300개의 각 분석값에서 Dissolution 열을 Dissolution 시뮬레이션 계산식 열을 사용하여 시뮬레이션된 값으로 대체하도록 요청합니다.

6. (선택 사항) 난수 시드값을 123으로 설정합니다.

이렇게 하면 이 예의 값이 재현됩니다.

그림 10.16 완료된 시뮬레이션 창 

Completed Simulation Window

7. 확인을 클릭합니다.

테이블의 첫 번째 행은 추정값의 초기 값을 포함하므로 제외됩니다. 나머지 행에는 시뮬레이션된 값이 포함되어 있습니다.

8. Distribution 스크립트를 실행합니다.

9. Ctrl 키를 누른 채 Blend Speed 빨간색 삼각형을 클릭하고 표시 옵션 > 요약 통계량 사용자 정의를 선택합니다.

10. 0 개수를 선택합니다.

11. 확인을 클릭합니다.

12. Blend Speed에 대한 분포 보고서로 스크롤합니다.

그림 10.17 시뮬레이션된 Blend Speed 계수 추정값의 히스토그램 

Histogram of Simulated Blend Speed Coefficient Estimates

이 "요약 통계량" 보고서에서는 시뮬레이션의 103/300 = 34.3%에 대해 Blend Speed 추정값이 0임을 보여 줍니다.

더 많은 정보를 원하십니까? 질문이 있습니까? JMP 사용자 커뮤니티에서 답변 받기 (community.jmp.com).