예측 모델링 및 교차 검증

조직의 작년 업무 성과를 설명하는 것은 누구든지 할 수 있는 적당한 일입니다. 하지만 올바른 도구와 최신 기법이 없을 경우에는 신규 고객, 신규 공정 또는 새로운 위험과 관련된 예측 모형을 구축하기가 훨씬 더 어렵습니다. JMP Pro는 보다 나은 데이터 모형을 구축하기 위한 풍부한 알고리즘을 포함하고 있습니다. 예측 모델링을 위한 가장 유용한 일부 기법으로는 결정 트리, 부트스트랩 포리스트, 나이브 베이즈(Naive Bayes) 및 신경망을 들 수 있습니다.

JMP Pro의 분할 플랫폼은 현대적인 방법을 활용해 트리 구축 프로세스를 자동화합니다. 이 플랫폼은 K 최근접 이웃(K-NN) 모형에도 적합합니다.

랜덤 포리스트 기법을 활용하는 부트스트랩 포리스트는 데이터의 임의 부분집합을 사용해 결정 트리를 수십 개로 늘려가면서 이러한 트리에 속한 각 요인의 계산된 영향력에 대해 평균을 냅니다. 부스트된 트리 기법은 한 트리에서 다음 트리로 반복적으로 잔차 변동을 적합하게 만들면서 많은 단순 트리를 구축합니다.

나이브 베이즈 플랫폼은 베이즈 정리의 원리를 사용하여 범주형 반응을 예측할 수 있도록 합니다. 이 플랫폼을 사용하면 데이터에 나타나지 않는 예측 변수의 조합에 대한 예측도 가능합니다.

고급 신경망 플랫폼에서는 세 가지 활성 함수를 선택하여 1계층 또는 2계층의 신경망을 구축할 수 있을 뿐 아니라, 그래디언트 부스팅(gradient boosting)을 이용한 자동 모형 생성 기능도 제공됩니다. 이 플랫폼은 연속 X의 결측치와 변환을 자동으로 처리함으로써 시간과 수고를 덜어주며, 로버스트 적합 옵션을 포함합니다.

JMP Pro의 이들 플랫폼 모두에서는 교차 검증 방식을 사용하여 모형을 검증하고 미래의 데이터로 일반화합니다. 예측 모델링을 효과적으로 수행하려면 모형을 검증할 올바른 방법이 필요한데, 규모가 큰 모형의 경우에는 과대적합 문제에 쉽게 부딪힐 수 있습니다. 규모가 큰 모형은 항상 교차 검증을 실시해야 하며, JMP Pro는 데이터 분할 또는 보류를 통해 이를 수행합니다. 교차 검증 기법은 신규 고객, 신규 공정 또는 새로운 위험에 관한 미래의 데이터로 일반화될 수 있는 모형을 구축하는 데 도움을 주기 때문에 미래에 대해 데이터 중심의 추론을 수행할 수 있습니다.

데이터를 구축(훈련)용 데이터 세트, 검증용 데이터 세트 및 테스트(평가)용 데이터 세트로 구분하는 기법은 이미 오래 전부터 과대적합 문제를 방지하는 데 활용되어 왔는데, 이 기법을 활용하면 사용자가 구축하는 모형이 해당 모형을 구축하는 데 사용된 특정 표본의 특성에 의존하지 않게 됩니다. JMP Pro에서 사용되는 교차 검증에 대한 일반적인 접근법은 검증 열을 사용하는 것입니다. 검증 열 유틸리티를 (순수 임의 표본 또는 층화 임의 표본과 함께) 사용하면 주어진 데이터를 서로 다른 목적의 데이터 세트로 쉽게 분할할 수 있습니다.

구축용 데이터 세트는 모형을 구축하는 데 사용되며, 검증용 데이터 세트는 모형 구축 프로세스에서 해당 모형의 복잡도를 선택하는 데 도움을 줄 목적으로 사용됩니다. 마지막으로, 테스트용 데이터 세트는 모형 구축 프로세스에서 완전히 배제되며 해당 모형의 질을 평가하는 데 사용됩니다. 비교적 규모가 작은 데이터 세트의 경우 K-fold 교차 검증을 활용할 수도 있습니다. 이 프로세스는 새 데이터로 일반화되는 모형을 효과적으로 구축하는 데 도움을 줍니다.

관측 데이터만으로는 한계가 있다는 점을 고려하는 것이 중요합니다. 원인과 효과를 제대로 이해하려면 수차례에 걸쳐 실험계획법(DOE)을 활용할 필요가 있습니다. JMP는 최적의 DOE를 위해 세계적 수준의 도구를 쉽게 사용할 수 있는 형태로 제공합니다.

모형 비교

현실 세계에서 몇몇 종류의 모형은 특정 상황에는 잘 들어맞지만 다른 상황에는 잘 들어맞지 않습니다. JMP Pro에서는 모형을 제반 상황에 적합하도록 만드는 방법이 여러 가지가 있으므로 주어진 상황에 가장 잘 맞는 방법을 찾아야 합니다. 모형 구축에 대한 일반적인 접근법은 다양한 모형을 시도하는 것입니다. 즉, 상대적으로 복잡도가 높은/낮은 모형, 몇몇 요인/예측 변수가 있는/없는 모형, 상이한 종류의 모델링 방법을 이용해 구축된 모형 또는 여러 모형들의 평균적인 모형(앙상블 모형)을 시도할 수 있습니다.

이들 모형은 각각 해당 모형을 평가하는 데 활용할 수 있는 공통의 질적 척도인 R2, 오분류 비율, ROC 곡선, AUC, 리프트 곡선 등을 갖게 됩니다.

JMP Pro에서 모형 비교를 사용하면 다양한 적합에서 모든 저장된 예측 열을 비교할 수 있으며 적합도, 절약성 및 교차 검증의 최적 조합을 선택할 수 있습니다. JMP Pro는 이러한 비교를 자동으로 수행합니다. 그와 동시에, 시각적 모형 프로파일러와 상호작용하여 각 모형이 선택하는 주요 요인을 확인할 수 있습니다. JMP Pro에서 모형 비교를 사용하면 여러 모형을 동시에 쉽게 비교할 수 있으며 필요한 경우 단순 모형 평균화를 수행할 수도 있습니다.

공식 저장소(Formula Depot) 및 점수 코드 생성

이제 모형을 굳이 힘들게 관리할 필요가 없습니다. JMP Pro의 공식 저장소(Formula Depot)는 다양한 모형을 다룰 때 작업을 체계화하는 기능을 합니다. 이 중앙 저장소를 사용하면 JMP Pro의 모형을 C, SQL, SAS 또는 그 밖의 언어로 저장, 프로파일링 및 비교하고 선별적으로 배포할 수 있습니다.

다수의 모형을 구축할 때 모형 비교 수행에 필요한 수많은 예측 식 열이 추가되면서 데이터 테이블이 복잡해지는 문제도 사라집니다. 공식 저장소에 점수 코드를 저장한 후 새 데이터에 적용할 수 있습니다. 그 결과, 사용 중인 모형에 쉽게 접근하면서 다른 시스템으로 해당 모형을 간편하게 배포할 수 있는 중앙 모델링 허브가 형성됩니다.

SAS®의 풍부한 기능에 연결

예측 분석 및 데이터 마이닝을 위한 SAS 제품 중 하나인 JMP Pro는 SAS와 쉽게 연결되어 다양한 옵션을 확장하면서 업계 최고 수준의 SAS 분석 및 데이터 통합 기능에 액세스할 수 있도록 해줍니다. SAS 연결이 활성화되어 있는지 여부에 관계없이 JMP Pro는 JMP에 구축된 모형을 사용해 새 데이터를 쉽고 빠르게 점수화하는 SAS 코드를 출력할 수 있습니다.

현대적 모델링

일반화 회귀는 까다로운 데이터에 대해서도 보다 나은 모형을 적절하게 구축할 수 있는 새로운 모델링 기법입니다. 이 기법은 정규화 회귀법 또는 벌점 회귀법을 사용하는 일반화 선형 모형에 적합합니다.

상관관계가 강한 예측 변수가 있거나 관측값보다 많은 예측 변수가 있을 때는 표준 추정 기법이 제 기능을 하지 못합니다. 또한 (관측 데이터에서 흔히 볼 수 있는 것처럼) 상관관계가 있는 예측 변수가 많을 때는 단계별 회귀나 그 외 표준 기법들이 불만족스러운 결과를 생성할 수 있습니다. 이러한 모형은 과대적합 문제를 나타낼 때가 많으며 새 데이터로 일반화하는 것도 제대로 처리하지 못합니다. 모델링에 앞서 추려내야 할 변수를 어떻게 결정하고 있습니까? 혹은, 모델링을 준비할 때 데이터 세트를 수동으로 전처리하기 위해 얼마나 많은 시간을 허비하고 있습니까?

다중 모형 적합의 일반화 회귀 개인별 맞춤은 회귀 수행에 대한 포괄적인 접근법입니다. 이 접근법은 변수 선택에서 시작해 모형 진단을 거쳐 LS 평균 비교, 역예측 및 프로파일링에 이르는 완전한 모델링 프레임워크입니다. 이러한 기능은 JMP Pro에만 있습니다.

일반화 회귀 개인별 맞춤 내에서 사용할 수 있는 정규화 기법으로는 능선, Lasso, 적응형 Lasso, Elastic Net 및 적응형 Elastic Net이 있으며, 이러한 기법들은 설명 능력을 가진 X를 더 잘 파악하는 데 도움이 됩니다. 이러한 기법들은 다중 모형 적합에 있는 다른 모든 모델링의 개인별 맞춤만큼이나 쉽게 활용할 수 있습니다. 즉, 반응을 확인하고, 모형 효과를 구성하고, 원하는 추정 방법 및 검증 방법을 고르기만 하면 됩니다. JMP는 데이터를 자동으로 적합하게 만들고, 적절한 경우 변수 선택을 수행하며, 새 데이터로 일반화할 수 있는 예측 모형을 구축합니다. 또한 전진 단계별 기법을 활용하거나 분위수 회귀를 수행하거나 최대 우도를 사용한 단순 적합을 실행할 수도 있습니다.

마지막으로, 일반화 회귀는 현재 모델링 중인 반응에 적합한 분포를 선택할 수 있는 옵션을 제공하기 때문에 총계, 이상치가 많은 데이터 또는 비대칭 데이터 등 더욱 다양한 반응을 모델링할 수 있습니다. 또한 JMP Pro의 모든 고급 모델링 플랫폼과 마찬가지로 원하는 교차 검증 기법을 선택할 수 있습니다.

신뢰성 블록 다이어그램

때로는 더욱 복잡한 분석 시스템의 신뢰성을 분석해야 할 경우가 종종 있는데, 이를테면 여러 개의 하드 드라이브가 있는 RAID 저장소 배열 또는 4개의 엔진을 탑재한 항공기가 이러한 예에 속합니다. JMP를 사용하면 이처럼 복잡한 시스템 내에서 단일 구성 요소의 신뢰성을 다양한 도구로 분석할 수 있습니다. 그러나 JMP Pro를 사용하면 이보다 더 나아가 단일 구성 요소의 신뢰성을 활용하여 여러 구성 요소로 이루어진 복잡한 시스템을 구축한 다음 전체 시스템의 신뢰성을 분석할 수 있습니다. 신뢰성 블록 다이어그램을 사용하면 시스템 내 취약점을 쉽게 설계 및 수정할 수 있으며, 향후 시스템 고장을 예방하기 위해 필요한 정보를 보다 원활하게 확인할 수 있습니다.

이 플랫폼을 사용하면 서로 다른 설계를 살펴보고 여러 시스템 설계 간에 도표를 비교함으로써 가정 상황(what-if) 분석을 쉽게 수행할 수 있습니다. 또한 중복성을 확대하면서 시스템 고장 확률을 낮추기 위한 최적의 위치를 결정할 수도 있습니다.

수리 가능 시스템 시뮬레이션

복잡한 시스템에서 일부 시스템이나 구성 요소가 장시간 오프라인 상태가 되면 감당할 수 없을 정도로 많은 비용이 소요됩니다. 이러한 시스템을 전체적으로 완전하게 유지 관리하려면 시스템 구성 요소에 대한 수리 일정을 계획하거나, 시스템을 가동할 수 없는 기간 동안 추가 수리 작업을 완료함으로써 예상치 못한 운영 중단을 통해 실현할 수 있는 이득을 극대화해야 합니다. JMP Pro에서는 수리 가능 시스템 시뮬레이션을 활용해 시스템 운영 중단 시간을 결정할 수 있으며, 주어진 기간 동안 예상되는 수리 가능 이벤트의 수와 수리 이벤트 하나에 소요되는 비용 등 주요 문제에 대한 답을 찾을 수 있습니다.

배열 설계

배열 설계는 요인 상호작용으로 인해 고장이 발생하거나 각 실험 실행에 많은 비용이 들 수 있는 응용 프로그램 검정에 사용됩니다. 결과적으로 결함을 발견할 확률은 최대한 높이면서 비용과 시간은 최소화되도록 실험을 계획해야 합니다. 배열 설계는 바로 이러한 일을 가능하게 합니다. JMP Pro를 사용하면 결정적 시스템을 검정하고 일정한 상호작용 순서에 따라 요인의 모든 가능한 조합을 검정하도록 실험을 설계할 수 있습니다.

현실적으로 타당하지 않은 조건을 생성하는 요인 조합이 있을 경우, 상호작용 방식의 허용되지 않는 조합(Disallowed Combinations) 필터를 사용하면 이러한 요인 설정 조합을 실험 계획에서 제외할 수 있습니다.

JMP Pro에서 제공하는 배열 설계의 큰 장점 중 하나는 JMP Pro가 단순히 배열 설계용 도구가 아니라 통계 분석 도구라는 점입니다. JMP Pro에서는 모든 종류의 통계 분석을 수행할 수 있습니다. 예를 들어, 일반화 회귀를 사용해 데이터를 분석할 수도 있는 배열 설계용 소프트웨어는 현재 JMP Pro가 유일합니다. 이 점이야말로 다른 배열 설계용 도구와 대비되는 JMP Pro의 특별한 장점입니다.

JMP Pro는 실험 계획용 도구에 국한되지 않으며, 소프트웨어에 의해 생성된 모든 배열 설계를 가져와 이를 최적화하고 그 결과를 분석할 수 있는 기능도 갖추고 있습니다. 또한 다른 사람에게 실험 구축을 의뢰하지 않고 직접 배열을 설계할 수도 있습니다. JMP Pro의 배열 설계로 더욱 스마트한 검정을 수행할 수 있습니다.

혼합 모형

혼합 모형은 분석 시 고정 효과와 임의 효과를 모두 포함합니다. 이러한 모형을 사용하면 시간과 공간을 모두 포함하는 데이터를 분석할 수 있습니다. 예를 들면, 약물 임상 시험 중 다수의 피험자를 수차례 측정하는 연구 실험 계획이나 제약업계, 제조업계 또는 화학업계의 교차 실험 계획에서 혼합 모형을 사용할 수 있습니다.

JMP Pro를 사용하면 고정 효과, 임의 효과 및 반복 효과를 지정하여 혼합 모형을 사용자의 데이터에 적합하게 만들 수 있을 뿐 아니라 변수 그룹의 상관관계를 나타낼 수 있으며 개체 효과와 연속 효과를 설정할 수도 있습니다. 이 모든 작업은 직관적인 드래그-앤-드롭 방식 인터페이스를 통해 수행할 수 있습니다.

또한 이제 매우 다양한 상관관계 구조에 대해 공분산 모수를 계산할 수 있습니다. 이를테면 데이터 측정 대상인 실험 단위를 여러 군집으로 그룹화할 수 있는 경우와 하나의 공통 군집에 속한 데이터가 상관관계를 나타내는 경우가 이러한 예에 속합니다. 또 다른 예로는 동일한 실험 단위에서 반복 측정을 실시할 때 반복 측정값에서 상관관계가 나타나거나 변화하는 변이가 나타나는 경우를 들 수 있습니다.

또한 JMP Pro에서 혼합 모형을 구축할 때 모형 지정에서 활용하기에 적합한 공간 공분산 구조(있는 경우)도 시각적으로 쉽게 판별할 수 있습니다.

반응 향상 모형

호의적으로 반응할 가능성이 있는 개인들에게만 할인 정보를 발송함으로써 한정된 마케팅 예산의 효과를 극대화하고자 할 수 있습니다. 이러한 작업은 특히 대규모의 데이터 세트와 수많은 행동학적 또는 인구통계학적 예측 변수가 존재할 경우 매우 부담스러울 수 있습니다. 반응 향상 모형은 이러한 상황에서 도움이 될 수 있습니다. 점증(incremental) 모델링, 트루 리프트(true lift) 모델링 또는 네트(net) 모델링으로도 알려진 반응 향상 모형은 최선의 마케팅 결정을 내리고, 환자 개인에 맞는 약물 임상 시험 계획서를 정의하며, 더 나아가 어떤 조치에 반응을 보일 가능성이 있는 개인의 특성을 확인하는 데 도움을 주고자 개발되었습니다.

JMP Pro의 반응 향상 모델링을 사용하면 이러한 예측을 수행할 수 있습니다. JMP Pro는 처리 그룹 간 차이를 극대화할 수 있는 분할을 찾는 분할 모형에 적합합니다. 이러한 모형은 어떤 조치에 대해 호의적으로 반응할 가능성이 가장 높은 개인이 속한 그룹을 식별하는 데 도움이 됩니다. 즉, 이러한 모형은 리소스 할당과 개인에 대한 영향을 최적화하면서 효율적이고도 선별적인 결정을 내릴 수 있도록 도와줍니다.

고급 계산 통계

JMP Pro는 분할표에 대한 정확 통계 검정과 일원 분산분석에 대한 비모수적 정확 통계 검정을 포함하고 있습니다. 또한 JMP Pro는 대부분의 JMP 보고서에 통계 부트스트랩을 위한 일반적인 방법을 포함하고 있습니다.

부트스트랩은 통계량의 표집 분포에 대한 근사치를 계산합니다. JMP Pro는 단 한 줄의 코드를 작성하지 않고도 통계량을 부트스트랩할 수 있는 유일한 통계 소프트웨어 패키지입니다. 원클릭 부트스트랩은 JMP 보고서에서 수량에 관계없이 단 한 번의 클릭으로 부트스트랩할 수 있음을 의미합니다.

이러한 기법은 교과서의 가정에 의문이 들거나 이러한 가정이 아예 존재하지 않을 때 유용합니다. 예를 들면, 예측을 수행하는 데 사용되거나 분위수를 중심으로 포함 구간을 결정하는 비선형 모형 결과에 대해 부트스트랩 기법을 적용해 볼 수 있습니다. 또한 예측 모형의 불확실성을 판단하기 위한 대안으로 부트스트랩을 사용할 수도 있습니다. 부트스트랩을 사용하면 비교적 적은 수의 가정을 통해 추정값의 신뢰도를 평가할 수 있습니다. JMP Pro의 원클릭 부트스트랩 기능을 활용하면 이러한 평가를 쉽게 수행할 수 있습니다.

결과의 공유 및 전달


Dow Chemical은 의사결정권자가 대량의 데이터 세트를 탐색하고 거기에서 최대한 많은 정보를 효율적으로 끌어낼 수 있는 최상의 도구를 직원들에게 제공하기 위해 JMP Pro를 도입했습니다.

고객 사례를 읽어 보십시오 (영문)

JMP는 늘 새로운 발견을 추구해 왔으며 조직에서 그러한 발견을 전달할 최선의 방법을 찾고 있습니다. JMP Pro는 JMP의 모든 시각적인 상호작용 기능을 포함하고 있기 때문에 이전에는 경험할 수 없었던 방식으로 데이터에 액세스할 수 있습니다. JMP Pro는 동적으로 연결된 데이터, 그래픽 및 통계를 통해 조사 결과를 3D 도표 또는 시간에 따른 변화를 보여주는 애니메이션 그래프의 형태로 실감나게 전달하기 때문에 모형 구축 및 설명 프로세스 모두에 영향을 주는 가치 있는 새로운 통찰력을 만들어 냅니다.

JMP® Pro에만 있는 주요 기능

JMP Pro는 JMP의 모든 기능은 물론, 아래에 열거한 분석 기능을 추가로 포함하고 있습니다.


예측 모델링

신경망 모델링
  • 결측치를 자동으로 처리
  • 그래디언트 부스팅(gradient boosting)을 이용해 은닉마디 수를 자동으로 선택
  • 1계층 및 2계층 신경망에 모두 적합
  • 입력 변수를 자동으로 변환
  • 3가지 활성 함수(쌍곡 탄젠트, 선형, 가우스)
  • 임의로 생성된 교차 검증 열을 저장
  • 변환된 공변량을 저장
  • 검증 열을 지원
되풀이 분할 모델링
  • 다양한 방법 선택: 결정 트리, 부트스트랩 포리스트(랜덤 포리스트 기법), 부스트된 트리, K 최근접 이웃, 나이브 베이즈
  • 난수 초기값 설정, 멀티스레딩 억제, 실험 계획을 조정할 수 있는 테이블 사용, 부스트된 트리와 부트스트랩 포리스트에서 확률적 기울기 하강 사용 가능
  • 검증 열을 지원
  • 다음에 대한 전용 모형 시작 옵션 제공: 부트스트랩 포리스트, 부스트된 트리, K 최근접 이웃 및 나이브 베이즈
모형 비교
  • JMP Pro에 구축된 여러 모형을 비교
  • 프로파일러
  • 적합 통계량(R2, 오분류 비율, ROC 곡선, AUC, 리프트 곡선)
  • 모형 평균화
훈련/검증/평가 구분(검증 열) 생성
  • 데이터를 훈련(구축), 검증 및 평가(테스트) 부분으로 자동 분할하여 검증 열 생성
  • 공식 임의 표집법, 고정 임의 표집법, 층화 임의 표집법, 그룹 임의 표집법, 절단점 표집법 등을 통해 보류 데이터 세트를 생성
  • 검증 열 역할을 마우스로 클릭하여 플랫폼 시작부터 검증 열 생성(공식 임의 표집법만 해당)
공식 저장소
  • 공식 열 스크립트를 저장 및 관리합니다.
  • 판별, 최소 제곱 적합(7가지 명령), 로지스틱 적합(명목 및 순서), 결정 트리, 부트스트랩 포리스트, 부스트된 트리, 반응 향상, K 최근접 이웃, 나이브 베이즈, 신경망, 잠재 클래스 분석, 주성분(와이드 및 스파스), 일반화 회귀, PLS, 가우스 과정에 대해 사용 가능한 명령을 게시합니다.
  • 스코어 코드 생성: SAS(DS2), C, Python, JavaScript, SQL(서로 다른 대상에 대해 구문 옵션을 선택)
  • 모형 비교를 이용해 공식 저장소에 수집된 모형들을 직접 비교
  • 프로파일러
  • 스크립트 표시, 스크립트 복사, 공식 복사, 공식을 열 변환으로 복사, 스크립트를 실행하여 데이터 테이블에서 공식 열을 생성
  • 데이터 테이블 열의 공식을 추가합니다.

텍스트 탐색기(Text Explorer) 분석 기능

  • 잠재 클래스 분석
  • 잠재 의미 분석(스파스 SVD)
  • 주제 분석(회전된 SVD)
  • 군집 용어 및 문서
  • SVD 및 주제 산점도 행렬
  • 열 저장: 단일 벡터 및 주제 벡터 문서화, 연관성에 대한 누적 DTM
  • 공식 저장: 단일 벡터, 주제 벡터
  • 벡터 저장: 용어 및 주제

신뢰성 및 생존 모형

신뢰성 블록 다이어그램(RBD)
  • 복잡한 시스템의 신뢰성에 대한 모형을 구축합니다.
  • 기본 노드, 직렬 노드, 병렬 노드, 매듭 노드 및 K/N 노드(K out of N node)를 이용해 시스템을 구축합니다.
  • 설계 라이브러리의 요소를 사용해 지분 설계를 구축합니다.
수리 가능 시스템 시뮬레이션(RSS)
  • 이산 이벤트 시뮬레이션 기반 엔진
  • 전통적인 유지관리를 지원: 상용 구축 블록으로서 사후 유지관리 및 예방 유지관리
  • 단일 작업 공간에 RBD와 병행하여 유지관리 계획에 대한 도식적 표현을 도입
  • 여러 구성 요소에 걸쳐 이벤트 요소와 조치 요소 간의 도식적 연결을 통해 그룹화된 유지관리와 유지관리 종속성의 개념을 전달
모수 생존
  • 다중 모형 적합의 일반화 회귀 개인별 맞춤과 연결함으로써 변수 선택을 지원합니다
일반화 회귀
  • 생존/신뢰성 데이터와 함께 변수를 선택할 수 있도록 중도절단 데이터를 처리합니다.
  • Cox 비례 위험을 지원
  • 와이블 분포, 로그 정규 분포, 지수 분포, 감마 분포, 정규 분포 및 ZI 분포군을 지원합니다.

다중 모형 적합

일반화 회귀
  • 정규화 기법: 능선, Lasso, 적응형 Lasso, 이중 Lasso, Elastic Net, 적응형 Elastic Net
  • 전진 선택 및 2단계 전진 선택
  • 분위수 회귀
  • 생존/신뢰성 데이터와 함께 변수를 선택할 수 있도록 중도절단 데이터를 처리합니다.
  • Cox 비례 위험
  • 일반 시뮬레이션 플랫폼에서 사용할 시뮬레이션 공식을 저장합니다.
  • 정규 분포, 로그 정규 분포, 와이블 분포, Cauchy 분포, 지수 분포, 감마 분포, 베타 분포, 이항 분포, 베타 이항 분포, 포아송 분포, 음이항 분포
  • 영과잉 이항 분포, 베타 이항 분포, 포아송 분포, 음이항 분포, 감마 분포
  • 다양한 검증 방법 선택: 검증 열, K-fold, 보류, Leave-One-Out, BIC, AICc, ERIC
단계별 회귀
  • 검증 열을 지원
로지스틱 회귀(명목 및 순서)
  • 검증 열을 지원
표준 최소 제곱
  • 검증 열을 지원
부분 최소 자승법(PLS)
  • 다중 모형 적합에서 PLS 개인별 맞춤은 연속 반응 또는 범주형 반응(연속 요인 또는 범주형 요인), 상호작용 및 다항식 항을 지원합니다.
  • NIPALS형 결측치 처리
  • 임의로 생성된 교차 검증 열을 저장
  • 중심화 및 척도화 옵션을 적용하기 전에 다항식 효과에 포함되는 개별 변수를 중심화하고 척도화하는 X 표준화 옵션
  • 다양한 검증 방법 선택: 검증 열, K-fold, 보류, Leave-One-Out
혼합 모형
  • 고정 효과, 임의 효과 및 반복 효과를 지정합니다.
  • 변수 그룹 간 상관관계를 나타내면서 개체 효과와 연속 효과를 설정합니다.
  • 반복된 공분산 구조를 선택
  • 가장 적절한 공간 상관관계 구조(있는 경우)를 결정하기 위한 시각적 진단 방법으로 변동도가 사용됩니다.

배열 설계

  • 배열 설계를 수행하고 분석합니다.
  • 실행을 추가로 줄이기 위해 앞서 생성된 설계를 최적화합니다.
  • 허용되지 않는 조합(Disallowed Combinations) 필터를 사용해 실현 불가능 검정 영역을 지정합니다.
  • 다른 소프트웨어에서 생성된 배열 설계를 가져와서 범위를 분석하고 사용자의 선택에 따라 최적화를 추가로 수행합니다.

다변량 방법

판별 분석
  • 검증 열을 지원

전문 모형

가우스 과정
  • 빠른 GASP를 통해 수천 개의 행으로 모형을 적합하게 만드는 기능
  • 사용 중인 가우스 과정 모형에 범주형 변수를 추가

소비자 조사

반응 향상 모형
  • 어떤 제안 또는 처리에 대해 호의적인 반응을 보일 가능성이 가장 높은 소비자 부문을 식별하기 위한 결정 트리 방법
  • 점증(Incremental) 모델링, 트루 리프트(true-lift) 모델링, 네트(Net) 모델링 기법
  • 검증 열을 지원
선택 컨조인트 모형
  • 선택 컨조인트 분석에서 계층적 베이즈를 지원
  • 조사 대상 추정값과 베이즈 연쇄(Bayes Chain)를 저장합니다.
연관성 분석
  • 장바구니 분석을 지원
  • 텍스트 탐색기(Text Explorer) 플랫폼에 의해 생성된 누적 문서 용어 행렬을 분석합니다.

고급 계산 통계

일원 분석
  • 비모수 정확 검정
분할표 분석
  • 정확 연관성 측도
일반 부트스트랩
  • 대부분의 보고서에서 한 번의 클릭으로 통계량을 부트스트랩합니다.
일반 시뮬레이션 기능
  • 한 번의 클릭으로 대부분의 보고서에서 통계량을 시뮬레이션합니다.
  • 거의 모든 대상에 대해 검정력 계산
  • 모수 부트스트랩을 지원
  • 랜덤화 검정

시스템 요구 사항

JMP는 Microsoft Windows와 Mac OS에서 실행되며, 32비트 시스템과 64비트 시스템을 모두 지원합니다.

Back to Top