JMP Pro gradation

JMP® Pro 13의 새로운 기능

JMP Pro는 JMP 소프트웨어의 고급 분석 버전으로, 사용자들에게 익숙한 JMP의 모든 기능 뿐 아니라 고급 기능까지 추가로 제공합니다. JMP Pro 13에서 사용자는 새로 추가된 기능, 예측 모델링 워크플로우의 향상된 기능 그리고 대부분의 JMP Pro 플랫폼에 대해 향상된 성능 개선 사항을 누릴 수 있습니다.

JMP Pro 13을 얻는 방법 알아보기

JMP Pro

텍스트 탐색기의 분석 기능

JMP 13에서 새롭게 선보이는 텍스트 탐색기는 비구조적 텍스트 데이터를 처리하기 위한 플랫폼입니다. JMP 13에서도 기본적인 단어와 구문을 추출하는 기능을 제공하지만, JMP Pro는 다변량 분석과 차원 축소를 위한 여러 가지 추가 기능을 제공하므로 사용자가 텍스트 데이터를 예측 모델링 작업에 반영할 수 있습니다.

JMP Pro는 수리 기록, 프리 텍스트 형식의 설문조사, 긴 설명 필드 및 자유 형식의 주석 등 거의 모든 유형의 텍스트 데이터를 맞춤형 분석을 통해 숫자 데이터로 변환할 수 있습니다. 이렇게 생성된 숫자 데이터는 JMP Pro 모델링 플랫폼에 바로 사용할 수 있습니다. 이제 비구조적 데이터에 담긴 정보로, 부트스트랩 포리스트, 신경망 또는 일반화 회귀 모형과 같은 즐겨 사용하는 JMP Pro 모형을 강화할 수 있습니다.

텍스트 데이터로 이미 확보한 예측 변수를 보완하면 외적 타당성이 더 뛰어난 모형을 구축할 수 있습니다. 비구조적 데이터를 데이터베이스에 저장하는 데 이미 많은 시간과 노력을 들이고 있는 상황에서 텍스트 탐색기는 큰 도움이 됩니다.

공식 저장소(Formula Depot) 및 스코어 코드 생성

이전 버전의 JMP에서는 여러 모형을 비교하려면 각 모형의 예측 열을 데이터 테이블에 저장해야 했습니다.경우에 따라서는(예: 신경망) 이로 인해 테이블의 리소스 소모량이 크게 증가할 수 있습니다. 또한 새로운 열의 명명 규칙은 값을 예측하려는 열의 이름에만 연결되고 해당 모형이 적합화된 플랫폼에는 연결되지 않았습니다. 이로 인해 주어진 예측 공식 열을 생성하는 데 사용된 플랫폼이 어떤 것인지 알기가 어려웠습니다. JMP 13 Pro 공식 저장소는 이러한 요구 사항을 모두 해결할 뿐 아니라, C, JavaScript, Python, SQL 또는 SAS로 모형을 체계화, 프로파일링, 비교 및 선택적으로 배포할 수 있는 중앙 저장소를 제공함으로써 모형을 훨씬 쉽게 배포할 수 있도록 해줍니다.

일반화 회귀 개선 사항

JMP Pro의 일반화 회귀는 사용자의 모든 모델링 요구 사항을 충족하도록 설계되었습니다. JMP의 일반화 회귀는 최신의 일반화 선형 모형 및 변수 선택 방식이자, 수명/생존 데이터를 비롯한 DOE 및 관찰 데이터를 한곳에서 분석할 수 있는 세계적인 수준의 도구입니다.

JMP 13은 일반화 회귀의 세 번째 릴리스로서 새로운 기능이 많이 추가되어 한층 더 발전했습니다.

  • 이중 Lasso 옵션: 1차 적응형 Lasso 단계를 통해 변수를 선별한 다음, 그 결과인 모수 추정값을 가중치로 사용하여 2차 적응형 Lasso 단계를 수행함으로써 모형을 세부 조정합니다.
  • 2단계 전진 선택 옵션 추가: 1차 전진 선택에서는 주효과만 고려하며 2차 단계에서는 상호작용 및 고차 항을 고려합니다. 이 기법은 계획된 실험에서 모형 선택 시 우수한 특성을 나타냅니다.
  • 생존/신뢰도 데이터를 적합화할 때 변수 선택이 가능하도록 중도절단된 데이터를 처리하며, Cox 비례 위험 모형을 지원하고, 와이블, 로그 정규 분포 및 정규 분포를 지원합니다.
  • 일반적인 개선 사항:
    • 벌점 회귀 문제에 최적화된 ERIC이라는 새로운 모형 선택 기준.
    • ROC 및 리프트 곡선.
    • 혼동 행렬CDF 및 분위수 프로파일러(예: 모수 생존).
    • 절편 없음 모형 및 서열 예측 변수 지원.
    • 활성 효과를 적용하여 다시 시작, 향상된 모형 진단 기능, 시뮬레이션 유틸리티에 사용할 수 있는 시뮬레이션 공식을 저장하는 기능.

수리 가능 시스템 시뮬레이션(RSS)

JMP에 이전 버전에서는 고장이 곧 시스템의 폐기를 의미하는 신뢰도 설정에서만 시뮬레이션을 사용할 수 있었습니다.그러나 항공기 엔진과 같이 수리 가능한 수많은 구성 요소로 이루어진 복잡한 고가의 시스템은 대개 고장이 발생할 경우 폐기 처분되지 않고 가능한 한 수리를 하게 됩니다. JMP 13 Pro의 수리 가능 시스템 시뮬레이션을 사용하면 수리 가능한 시스템을 분석할 수 있으므로 다음과 같은 정보를 얻을 수 있습니다.

  • 장치의 "수리 가능 수명" 동안의 평균 고장 발생 간격.
  • 장치의 가용성.
  • 즉, 장치가 정상 작동하는 시간의 비율.
  • 장치의 수리 가능 수명 동안의 예상 수리 비용시스템 다운타임 및 유지 보수 시간을 가장 많이 발생시키는 구성 요소.
  • 다른 수리 작업을 위해 시스템 가동이 중단된 동안 이를 기회로 삼아 수리/교체해야 하는 구성 요소.

JMP Pro 13의 RSS 플랫폼은 신뢰성 블록 다이어그램 플랫폼과 동일한 인터페이스를 사용하므로 신뢰성 담당 엔지니어가 새로운 인터페이스를 익힐 필요 없이 바로 모형을 구축할 수 있습니다.

일반 시뮬레이션 기능

통계 전문가와 분석가는 시뮬레이션을 통해 새로운 통계 기법을 평가하고 비표준 통계 검정의 검정력을 추정하며 모수적 부트스트랩을 수행합니다. JMP 13에서는 더 이상 사용자가 시뮬레이션을 수행하고 결과를 분석하기 위해 사용자 정의 JSL을 작성할 필요가 없으므로 일반 시뮬레이션 기능을 손쉽게 이용할 수 있습니다. 이 기능은 대부분의 플랫폼에서 사용 가능하며, 자동 재계산 또는 부트스트랩이 빨간색 삼각형 메뉴 옵션으로 제공됩니다.

DOE에도 이 시뮬레이션 기능이 유용합니다. 계획된 실험에서 반응이 항상 정규 분포되거나 정규 분포에 근접하는 것은 아닙니다. 일례로 시스템 검사에서는 카운트 데이터 또는 통과/실패 기반의 데이터를 생성할 수 있습니다. 이제 JMP 13 사용자 정의 디자이너에서는 이러한 실험에 대해 현실적인 반응 데이터를 시뮬레이션할 수 있으며, JMP Pro 사용자는 이 시뮬레이션된 출력을 JMP Pro 일반 시뮬레이션 기능과 함께 사용하여 실험 계획의 실험 검정력을 추정할 수 있습니다.

마지막으로, JMP Pro의 프로파일러에 Bagging(부트스트랩 집계) 기능이 추가되어 사용자가 예측 구간 공식이 없는 설정에서 예측 구간을 생성할 수 있게 되었습니다. 이전에는 검증 열을 생성하려면 여러 번의 클릭을 통해 데이터 세트를 구축(훈련), 검증 및 테스트 세트로 나누는 수동적인 과정을 거쳐야 했습니다. 분할을 위해 데이터의 단순한 임의 표본 이상이 필요한 경우 추가 기능 또는 다른 기법을 사용하여 최적 분할을 생성해야 했습니다.

이제는 포함된 몇 가지 알고리즘 중 하나를 사용하여 문제에 맞게 데이터를 분할할 수 있습니다. 또한 분석 플랫폼에서 열을 선택하지 않고 검증 열 역할을 클릭하면 검증 열을 선택하거나 플랫폼에서 직접 검증 열을 생성하라는 메시지가 나타납니다. 이로써 분석 흐름을 유지할 수 있으며 몇 번의 클릭으로 쉽게 교차 검증을 수행할 수 있습니다.

계층적 베이즈

선택 컨조인트 모형은 기업이 고객에게 가장 중요한 제품과 기능을 결정하고 특정 기능에 고객이 기꺼이 지불할 금액을 확인하는 데 유용합니다.

모든 고객을 동일하게 취급하는 선택 컨조인트 모형은 개인별 선호를 무시하고 평준화된 추정값을 산출합니다.대부분의 경우 그렇듯이, 실제로 개인별 선호에 상당한 차이가 있는 경우 이 모형으로 결정된 "최적" 제품이 실제로는 존재하지 않는 "평균" 고객은 만족시키지만 실제로 존재하는 고객은 전혀 만족시키지 못할 수 있습니다.

JMP 13 Pro는 이러한 선호도의 차이를 제대로 모델링할 수 있는 계층적 베이즈를 지원합니다. 계층적 베이즈를 사용하면 선택 컨조인트 계획에서 더 효과적이고 품질이 높은 모형을 만들어 한정된 실행 예산으로 획득하는 정보를 극대화할 수 있습니다.

연관성 분석

주로 장바구니 분석이라고 하는 연관성 분석은 특정 이벤트, 레코드 또는 트랜잭션에서 함께 발생하는 항목을 식별하는 기법입니다.

다음은 연관성 규칙의 몇 가지 예입니다.

  • A 제품을 구매하는 쇼핑객의 80%가 B 제품을 구매합니다.
  • A 부품과 관련한 수리 건의 40%가 B 부품과도 관련이 있습니다.
  • 위험 요인 A, B, C를 가진 사람의 20%가 50세에 이르면 X 증상을 보입니다.

이 같은 연관성을 파악하면 마케팅, 의료, 제품 신뢰성 등의 다양한 상황에서 의사 결정권자가 정보를 얻을 수 있습니다.

JMP Pro 연관성 분석 플랫폼에서는 차원 축소 기법 중 하나인 특이값 분해(SVD)를 사용하여 유사한 트랜잭션을 그룹화할 수도 있습니다. 이 특이 벡터를 예측 모델링 플랫폼에 사용할 수 있습니다.

가우스 과정

가우스 과정 모형은 연속 반응과 하나 이상의 예측 변수 간 관계를 모델링하는 데 사용됩니다. JMP Pro의 이전 버전에서는 대규모 데이터 세트에 대해 이러한 모형을 실행하는 데 시간이 많이 걸렸으며 테이블 크기에 관계없이 범주형 요인이 있는 모형에 대해서는 이를 실행할 수 없었습니다. JMP Pro 13에서는 이 두 가지 문제가 모두 해결되어 가우스 과정 모형의 적용 범위가 훨씬 넓어졌습니다.

혼합 모형 개선 사항

JMP 13에서는 다중 모형 적합의 혼합 모형 개인별 맞춤 기능이 몇 가지 새로운 공분산 구조(이분산, 교환 가능 이분산, Antedependent, Toeplitz)를 제공하여 새로운 상황으로 다양하게 적용 범위를 확대합니다.

분할 개선 사항 및 나이브 베이즈

JMP Pro 13에서는 분할 플랫폼에 대한 제어 기능이 강화되었습니다. 모형 조정 테이블에서는 모수값 격자에 대해 모형을 실행할 수 있고, 부스트된 트리에 대한 확률적 그래디언트 부스팅(Stochastic Gradient Boosting) 옵션의 랜덤화 기능은 과대적합을 방지하는 데 도움을 줍니다. 나이브 베이즈 분류자도 제공됩니다.

설명서

JMP 및 JMP Pro의 새로운 기능에 대한 PDF를 다운로드하거나 온라인으로 검색 가능한 설명서를 참조하십시오.

Back to Top