발행일 : 03/10/2025

Image shown here분포 지정

"모형 적합" 시작 창의 "분석법"에서 "일반화 회귀"를 선택하면 "분포" 옵션이 나타납니다. 여기서 Y의 분포를 지정할 수 있습니다. 약어 ZI영과잉(Zero-Inflated)을 의미합니다. 분포는 반응에 따라 연속형, 이산형 및 영과잉의 세 가지 범주로 구분됩니다. 아래에 옵션에 대한 설명이 나옵니다.

참고: "모형 규격" 창에서 Y 변수를 여러 개 지정하는 경우 지정된 모든 Y 변수에 대해 동일한 반응 분포를 사용해야 합니다. 동일한 "일반화 회귀" 보고서에서 각 반응 변수마다 개별 분포를 적합시키려면 스크립트를 사용해야 합니다.

Image shown here연속형

정규

Y는 평균이 m이고 표준편차가 s인 정규 분포를 가집니다. 정규 분포는 대칭적이며, 표본 크기가 충분히 크면 중심 극한 정리에 의해 다양한 다른 분포가 정규 분포와 가까워질 수 있습니다. m의 연결 함수는 항등이며, 이는 Y의 평균이 선형 모형으로 표현됨을 의미합니다.

참고: 정규 분포가 지정된 경우 "표준 최소 제곱"이 "최대 가능도" 추정 방법을 대체합니다.

정규 분포의 척도 모수는 s입니다. 추정 방법에 벌점이 없는 경우 척도 모수 s의 추정값은 RMSE(제곱근 평균 제곱 오차)입니다. RMSE는 s2의 일반적인 비편향 추정량에 대한 제곱근입니다. 표시된 결과는 중도절단된 관측값이 포함된 경우가 아니면 표준 최소 제곱 적합과 동등합니다.

참고: 일반화 회귀 분석법에 사용되는 명목형 변수의 파라미터화는 표준 최소 제곱 분석법을 사용한 파라미터화와 다릅니다. 이 차이 때문에 명목형 또는 순서형 효과를 포함하는 모형에 대한 모수 추정값이 달라집니다.

자세한 내용은 분포에 대한 통계 상세 정보에서 확인하십시오.

Cauchy

Y는 위치 모수가 m이고 척도 모수가 s인 Cauchy 분포를 가집니다. Cauchy 분포는 평균과 표준편차가 정의되어 있지 않습니다. 중앙값과 최빈값은 모두 m입니다. 대부분의 데이터는 본질적으로 Cauchy 분포를 따르지 않습니다. 그러나 이상치 비율이 큰(최대 50%) 데이터에 대해 로버스트 회귀를 수행하는 데 유용합니다. m의 연결 함수는 항등입니다. 자세한 내용은 분포에 대한 통계 상세 정보에서 확인하십시오.

t(5)

Y는 자유도가 5이고 위치 모수가 m, 척도 모수가 s인 스튜던트 t 분포를 가집니다. 스튜던트 t 분포는 대칭적이며, 정규 분포와 Cauchy 분포 사이의 범위를 포괄하는 로버스트 옵션입니다. 스튜던트 t 분포의 자유도가 무한대에 가까워지면 정규 분포와 동등합니다. 스튜던트 t 분포의 자유도가 1이면 Cauchy 분포와 동등합니다. m의 연결 함수는 항등입니다. 자세한 내용은 분포에 대한 통계 상세 정보에서 확인하십시오.

지수

Y는 평균 모수가 m인 지수 분포를 가집니다. 지수 분포는 오른쪽으로 치우친 분포로, 대개 수명이나 연속된 이벤트 사이의 시간을 모델링하는 데 사용됩니다. m의 연결 함수는 로그입니다. 자세한 내용은 분포에 대한 통계 상세 정보에서 확인하십시오.

감마

Y는 평균 모수가 m이고 산포 모수가 s인 감마 분포를 가집니다. 감마는 널리 사용되는 다른 분포 계열을 포함하는 유연한 분포입니다. 예를 들어 지수 분포는 감마 분포의 특수한 경우로, s = m 입니다. 카이제곱 분포도 감마 분포에서 파생될 수 있습니다. m의 연결 함수는 로그입니다. 자세한 내용은 분포에 대한 통계 상세 정보에서 확인하십시오.

Weibull

Y는 평균 모수가 m이고 척도 모수가 s인 Weibull 분포를 가집니다. Weibull 분포는 유연한 분포로, 대개 수명이나 이벤트까지의 시간을 모델링하는 데 사용됩니다. m의 연결 함수는 항등입니다. 자세한 내용은 분포에 대한 통계 상세 정보에서 확인하십시오.

로그 정규

Y는 위치 모수가 m이고 척도 모수가 s인 로그 정규 분포를 가집니다. 로그 정규 분포는 오른쪽으로 편중된 분포로, 대개 수명이나 이벤트까지의 시간을 모델링하는 데 사용됩니다. m의 연결 함수는 항등입니다. 자세한 내용은 분포에 대한 통계 상세 정보에서 확인하십시오.

음의 로그 정규

Y는 위치 모수가 m이고 척도 모수가 s인 음의 로그 정규 분포를 가집니다. 음의 로그 정규 분포는 왼쪽으로 편중된 분포로, 순음수 관측값에만 사용할 수 있습니다. m의 연결 함수는 항등입니다. 음의 로그 정규 분포는 로그 정규 분포에 대한 음의 변환입니다. 자세한 내용은 분포에 대한 통계 상세 정보에서 확인하십시오.

베타

Y는 평균 모수가 m이고 산포 모수가 s인 베타 분포를 가집니다. 베타 분포에 대한 반응은 0에서 1 사이이며 대개 비율을 모델링하는 데 사용됩니다. m의 연결 함수는 로짓입니다. 자세한 내용은 분포에 대한 통계 상세 정보에서 확인하십시오.

분위수 회귀

분위수 회귀는 반응에 대한 지정된 조건부 분위수를 모델링합니다. 기본 분포의 형태에 대해서는 가정하지 않습니다. 분위수 회귀를 선택하면 "분포" 메뉴 아래에 "분위수" 상자가 나타납니다. 원하는 분위수를 지정합니다.

"모형 규격" 창에서 "분위수"에 "0.5"(기본값)를 지정할 경우 분위수 회귀는 반응의 조건부 중앙값을 모델링합니다. 분위수 회귀는 회귀 계수로 표현되는 조건부 분위수의 변화 비율이 분위수에 따라 달라지는 경우에 특히 유용합니다. 최소 제곱 회귀와 비교할 때 분위수 회귀의 장점은 이질적 조건부 분포를 사용하여 데이터를 모델링할 수 있는 유연성입니다.

분위수 회귀는 반복 방식을 통해 목적 함수를 최소화하여 적합됩니다. 분위수 회귀에 대한 자세한 내용은 Koenker and Hallock 연구 자료(2001) 및 Portnoy and Koenker 연구 자료(1997)에서 확인하십시오.

분위수 회귀를 선택할 경우 "추정 방법"에서 "최대 가능도"만 사용할 수 있으며 "검증 방법"에서는 "없음"만 사용할 수 있습니다.

참고: 분위수 회귀 적합에 시간이 많이 소요되는 경우 진행률 표시줄이 나타납니다. 진행률 표시줄에는 목적 함수의 상대적 변동이 표시됩니다. "현재 추정값 채택"을 클릭하면 계산이 중지되며 보고된 모수 추정값은 해당 지점에서 최적 모형 적합에 해당합니다.

Cox 비례 위험

Cox 비례 위험 모형은 예측 변수가 있는 사건 발생 시간 데이터에 대한 회귀 모형입니다. 이 모형은 예측 변수와 위험 함수 간의 승법 관계를 기반으로 합니다. 예측 변수가 생존 시간에 미치는 영향을 조사하는 데 이 모형을 사용할 수 있습니다. 모형에는 일반적인 위험 함수를 제공하기 위해 예측 변수로 척도화된 임의의 기준 위험 함수가 포함됩니다. 비례 위험 모형은 각 예측 변수에 대한 모수 추정값과 표준 오차를 생성합니다. Cox 비례 위험 모형은 D. R. Cox(1972)에 의해 처음 제안되었습니다. 비례 위험 모형에 대한 자세한 내용은 Kalbfleisch and Prentice 연구 자료(2002)에서 확인하십시오.

Cox 비례 위험을 선택할 경우 "검증 방법"에서 "BIC"와 "AICc"만 사용할 수 있습니다. 또한 능형 회귀 추정 방법을 사용할 수 없습니다.

참고: 반응에 동일 값이 있으면 Efron 가능도가 사용됩니다. 자세한 내용은 Efron 연구 자료(1981)에서 확인하십시오. 이 방법은 모형 적합 플랫폼의 비례 위험 분석법 또는 비례 위험 모형 적합 플랫폼에서 사용되는 동일 값 처리 방법과 다릅니다.

Image shown here이산형

이항

Y는 pn 모수가 있는 이항 분포를 가집니다. 반응 Y는 n번의 독립 시행(모든 시행에 대한 확률 p는 고정됨)에서 총 성공 횟수를 나타냅니다. 이 분포에서는 표본 크기 열을 사용할 수 있습니다. 나열된 열이 없으면 표본 크기가 1이라고 가정합니다. p의 연결 함수는 로짓입니다. 명목형 모델링 유형이 있는 이진 반응 변수를 선택하면 이항 반응 분포만 사용할 수 있습니다. 자세한 내용은 분포에 대한 통계 상세 정보에서 확인하십시오.

"분포"에서 "이항"을 선택하면 다음 방법 중 하나를 사용하여 반응 변수를 지정해야 합니다.

요약되지 않음: 데이터가 사건 빈도로 요약되지 않은 경우 단일 이진 열을 반응으로 지정합니다. 이 열의 모델링 유형이 명목형이면 수준 중 하나를 목표 수준으로 지정할 수 있습니다. 기본 목표 수준 값은 수준 순서에 따라 두 수준 중 더 높은 값입니다.

빈도 열로 요약됨: 데이터가 성공 및 실패 빈도로 요약되는 경우 단일 이진 열을 반응으로 지정합니다. 이 열의 모델링 유형이 명목형이면 수준 중 하나를 목표 수준으로 지정할 수 있습니다. 기본 목표 수준 값은 수준 순서에 따라 두 수준 중 더 높은 값입니다. 빈도 열을 빈도 역할에 할당합니다.

두 번째 Y로 입력된 표본 크기 열로 요약됨: 데이터가 사건(성공) 빈도 및 시행 횟수로 요약되는 경우, 성공 횟수-시행 횟수의 순으로 두 개의 연속형 열을 Y로 지정합니다.

참고: 이항 분포가 지정된 경우 "로지스틱 회귀"가 "최대 가능도" 추정 방법을 대체합니다.

베타 이항

Y는 성공 확률 p, 시행 횟수 n 및 과대산포 모수 d가 있는 베타 이항 분포를 가집니다. 이 분포는 이항 분포의 과대산포 버전입니다.

산포 모수 d를 갖는 베타 이항 분포를 모수 pn = 20을 갖는 이항 분포와 비교하려면 JMP Samples/Scripts 폴더에 있는 demoBetaBinomial.jsl을 실행하십시오.

베타 이항 분포를 사용하려면 각 관측값에 대해 표본 크기가 1보다 커야 합니다. 따라서 사용자는 표본 크기 열을 지정해야 합니다. 표본 크기 열을 삽입하려면 성공 횟수-시행 횟수의 순으로 두 개의 연속형 열을 Y로 지정합니다. p의 연결 함수는 로짓입니다. 자세한 내용은 분포에 대한 통계 상세 정보에서 확인하십시오.

다항

Y는 이산형 수준이 세 개 이상인 다항 분포를 가집니다. 반응 변수의 모델링 유형은 명목형 또는 순서형이어야 합니다. 이 모형은 반응 변수의 각 수준에 대해 별도의 절편 및 효과 모수를 적합시킵니다. 반응 변수의 수준이 k개이면 모형에 k - 1개의 절편 및 효과 모수가 포함됩니다. 다항 분포의 연결 함수는 다항 로짓입니다. 자세한 내용은 명목형 반응에서 확인하십시오.

순서형 로지스틱

Y는 순서형 수준이 있는 다항 분포를 가집니다. 반응 변수의 모델링 유형은 순서형이어야 합니다. 이 모형은 반응 변수의 각 수준에 대해 절편을 적합시킵니다. 효과 모수는 반응 변수의 모든 수준에서 공통입니다. 순서형 로지스틱 분포의 연결 함수는 순서형 로짓입니다. 자세한 내용은 순서형 반응에서 확인하십시오.

참고: 일반화 회귀에서 순서형 로지스틱에 대한 절편 파라미터화는 모형 적합의 순서형 로지스틱 분석법에서와 다릅니다. 일반화 회귀의 첫 번째 절편 항은 순서형 로지스틱 분석법의 첫 번째 절편 항에 해당합니다. 일반화 회귀의 후속 절편 항은 반응 변수의 순서형 수준에 대한 절편 항 간의 연속 차이입니다.

Poisson

Y는 평균이 l인 Poisson 분포를 가집니다. 일반적으로 Poisson 분포는 특정 구간 내의 사건 수를 모델링하며 대개 개수 데이터로 표현됩니다. l의 연결 함수는 로그입니다. Poisson 회귀는 Y가 정수가 아닌 값이더라도 허용됩니다. 자세한 내용은 분포에 대한 통계 상세 정보에서 확인하십시오.

음이항

Y는 평균이 m이고 산포 모수가 s인 음이항 분포를 가집니다. 일반적으로 음이항 분포는 지정된 실패 횟수에 도달하기 전의 성공 횟수를 모델링합니다. 또한 음이항 분포는 특정 조건에서 감마 Poisson 분포와 동등합니다. 음이항 분포와 감마 Poisson 분포 간 연결에 대한 자세한 내용은 기본 분석분포에서 확인하십시오.

평균 l 및 산포 모수 s를 갖는 감마 Poisson 분포를 평균 l를 갖는 Poisson 분포와 비교하려면 JMP Samples/Scripts 폴더에 있는 demoGammaPoisson.jsl을 실행하십시오.

m의 연결 함수는 로그입니다. 음이항 회귀는 Y가 정수가 아닌 값이더라도 허용됩니다. 자세한 내용은 분포에 대한 통계 상세 정보에서 확인하십시오.

Image shown here영과잉

ZI 이항

Y는 모수 p, n 및 영과잉 모수 p가 있는 영과잉 이항 분포를 가집니다. 반응 Y는 n번의 독립 시행(모든 시행에 대한 확률 p는 고정됨)에서 총 성공 횟수를 나타냅니다. 이 분포에서는 표본 크기 열을 사용할 수 있습니다. 나열된 열이 없으면 표본 크기가 1이라고 가정합니다. p의 연결 함수는 로짓입니다. 자세한 내용은 분포에 대한 통계 상세 정보에서 확인하십시오.

ZI 베타 이항

Y는 성공 확률 p, 시행 횟수 n, 과대산포 모수 d 및 영과잉 모수 p가 있는 베타 이항 분포를 가집니다. 이 분포는 ZI 이항 분포의 과대산포 버전입니다. ZI 베타 이항 분포를 사용하려면 각 관측값에 대해 표본 크기가 1보다 커야 합니다. 따라서 사용자는 표본 크기 열을 지정해야 합니다. 표본 크기 열을 삽입하려면 성공 횟수-시행 횟수의 순으로 두 개의 연속형 열을 Y로 지정합니다. p의 연결 함수는 로짓입니다. 자세한 내용은 분포에 대한 통계 상세 정보에서 확인하십시오.

ZI Poisson

Y는 평균 모수가 l이고 영과잉 모수가 p인 영과잉 Poisson 분포를 가집니다. l 모수는 0 팽창 없이 Poisson 분포의 관측값을 기반으로 하는 조건부 평균입니다. l의 연결 함수는 로그입니다. ZI Poisson 회귀는 Y가 정수가 아닌 값이거나 0 값이 관측되지 않더라도 허용됩니다. 자세한 내용은 분포에 대한 통계 상세 정보에서 확인하십시오.

ZI 음이항

Y는 위치 모수 m, 산포 모수 s 및 영과잉 모수 p가 있는 영과잉 음이항 분포를 가집니다. m 모수는 0 팽창 없이 음이항 분포의 관측값을 기반으로 하는 조건부 평균입니다. m의 연결 함수는 로그입니다. ZI 음이항 회귀는 Y가 정수가 아닌 값이거나 0 값이 관측되지 않더라도 허용됩니다. 자세한 내용은 분포에 대한 통계 상세 정보에서 확인하십시오.

ZI 감마

Y는 평균 모수가 m이고 영과잉 모수가 p인 영과잉 감마 분포를 가집니다. 많은 경우 0이 아닌 반응이 감마 분포를 따른다고 간주할 수 있습니다. 보험금 청구의 경우 여기에 해당합니다. 청구 값은 감마 분포에 근사하지만 청구가 없는 보험 증권에 대한 데이터에는 0도 있습니다. 영과잉 감마 분포는 데이터를 0 반응과 0이 아닌 반응으로 나누지 않고도 이러한 데이터를 직접 처리할 수 있습니다. m 모수는 0 팽창 없이 감마 분포의 관측값을 기반으로 하는 조건부 평균입니다. m의 연결 함수는 로그입니다. 자세한 내용은 분포에 대한 통계 상세 정보에서 확인하십시오.

Table 6.1에는 다양한 분포가 할당된 Y 변수의 데이터 유형, 모델링 유형 및 기타 요구 사항이 나와 있습니다.

표 6.1 분포에 대한 Y 요구 사항

분포

데이터 유형

모델링 유형

기타

정규

숫자

연속형

Cauchy

숫자

연속형

t(5)

숫자

연속형

지수

숫자

연속형

양수

감마

숫자

연속형

양수

Weibull

숫자

연속형

양수

로그 정규

숫자

연속형

양수

음의 로그 정규

숫자

연속형

음수

베타

숫자

연속형

0에서 1 사이

분위수 회귀

숫자

연속형

Cox 비례 위험

숫자

연속형

음수 아님

이항, 요약되지 않음

임의

임의

이진

이항, 빈도 열로 요약됨

임의

임의

이진

이항, 두 번째 Y로 입력된 개수 열로 요약됨

숫자

연속형

음수 아님

베타 이항

숫자

연속형

음수 아님

다항

임의

명목형 또는 순서형

순서형 로지스틱

임의

순서형

Poisson

숫자

임의

음수 아님

음이항

숫자

임의

음수 아님

영과잉 이항

숫자

임의

음수 아님

영과잉 베타 이항

숫자

임의

음수 아님

영과잉 Poisson

숫자

임의

음수 아님

영과잉 음이항

숫자

임의

음수 아님

영과잉 감마

숫자

연속형

음수 아님

이러한 분포를 파라미터화하는 방법에 대한 자세한 내용은 분포에 대한 통계 상세 정보에서 확인하십시오. Table 6.2에는 상세 정보가 요약되어 있습니다.

표 6.2 분포, 모수 및 연결 함수

분포

모수

평균 모형 연결 함수

정규

m, s

항등(m)

Cauchy

m, s

항등(m)

t(5)

m, s

항등(m)

지수

m

로그(m)

감마

m, s

로그(m)

Weibull

m, s

항등(m)

로그 정규

m, s

항등(m)

음의 로그 정규

m, s

항등(m)

베타

m

로짓(m)

분위수 회귀

m

항등(m)

Cox 비례 위험

m

로그(m)

이항

n, p

로짓(p)

베타 이항

n, p, d

로짓(p)

다항

n, p1, ..., pk

다항 로짓(p1, ..., pk)

순서형 로지스틱

p1, ..., pk-1

순서형 연결(p1, ..., pk-1)

Poisson

l

로그(m)

음이항

m, s

로그(m)

영과잉 이항

n, p, p(영과잉)

로짓(p)

영과잉 베타 이항

n, p, d, p(영과잉)

로짓(p)

영과잉 Poisson

l, p(영과잉)

로그(m)

영과잉 음이항

m, s, p(영과잉)

로그(m)

영과잉 감마

m, s, p(영과잉)

로그(m)

적절한 분포를 선택한 후 실행을 클릭합니다. 그러면 "일반화 회귀" 보고서 창이 나타납니다.

더 많은 정보를 원하십니까? 질문이 있습니까? JMP 사용자 커뮤니티에서 답변 받기 (community.jmp.com).