예측 및 전문 모델링
예측 및 전문 모델링에서는 반응 변수 선별, 분할, 신경망 등의 좀 더 전문적인 모델링 기법에 대해 자세히 설명합니다.
• 신경망 플랫폼에서는 하나 또는 두 개의 층으로 완전히 연결된 다중 계층 퍼셉트론을 구현합니다. 신경망을 사용하면 입력 변수의 유연한 함수를 사용하여 하나 이상의 반응 변수를 예측할 수 있습니다. 자세한 내용은 신경망에서 확인하십시오.
• 파티션 플랫폼에서는 X 값과 Y 값 사이의 관계에 따라 데이터를 재귀적으로 분할하여 파티션의 의사 결정 나무를 생성합니다. 자세한 내용은 파티션 모형에서 확인하십시오.
•
붓스트랩 포레스트 플랫폼을 사용하면 각각 훈련 데이터의 랜덤 부분집합에 적합되는 여러 의사 결정 나무를 평균화하여 앙상블 모형을 적합시킬 수 있습니다. 자세한 내용은 붓스트랩 포레스트에서 확인하십시오.
•
부스티드 트리 플랫폼에서는 계층에 생성된 여러 개의 더 작은 의사 결정 나무로 구성되는 가법 의사 결정 나무 모형을 생성합니다. 각 계층의 트리는 소수의 분할로 구성됩니다(보통 5개 이하). 각 계층은 재귀적 적합 방법론을 사용하여 적합됩니다. 자세한 내용은 부스티드 트리에서 확인하십시오.
•
K 최근접 이웃 플랫폼에서는 지정된 관측값의 국소적 근방에 있는 관측값의 반응을 사용하여 해당 관측값에 대한 반응 값을 예측합니다. 분류를 위한 범주형 반응 및 예측을 위한 연속형 반응과 함께 사용할 수 있습니다. 자세한 내용은 K 최근접 이웃에서 확인하십시오.
•
나이브 베이즈 플랫폼에서는 관측값을 범주형 반응 변수의 수준에 의해 정의된 그룹으로 분류합니다. 분류에 사용되는 변수 또는 요인을 데이터 마이닝 문헌에서는 흔히 피처라고 합니다. 자세한 내용은 나이브 베이즈에서 확인하십시오.
•
서포트 벡터 머신 플랫폼에서는 관측값을 범주형 반응 변수의 수준에 의해 정의된 그룹으로 분류합니다. 모형은 클래스를 구분하는 초평면을 최적화하여 데이터를 분류합니다. 자세한 내용은 서포트 벡터 머신에서 확인하십시오.
•
모형 선별 플랫폼을 사용하면 여러 예측 모형을 빠르게 실행하고 결과를 비교할 수 있습니다. 중첩된 진단 그림과 함께 각 모형에 대한 적합 측도가 제공됩니다. 자세한 내용은 모형 선별에서 확인하십시오.
•
모형 비교 플랫폼을 사용하면 여러 모형의 예측 능력을 비교할 수 있습니다. 중첩된 진단 그림과 함께 각 모형에 대한 적합 측도가 제공됩니다. 자세한 내용은 모형 비교에서 확인하십시오.
•
검증 열 생성 플랫폼을 사용하면 파티션을 생성하는 다섯 가지 방법 중 하나를 사용하여 데이터를 두 개 또는 세 개의 집합으로 분할할 수 있습니다. 자세한 내용은 검증 열 생성에서 확인하십시오.
•
계산식 저장소 플랫폼을 사용하면 배포할 모형을 구성, 비교 및 프로파일링하고 스코어링할 수 있습니다. 모형 탐색 작업의 경우 계산식 저장소를 사용하여 후보 모형을 JMP 데이터 테이블 외부에 저장할 수 있습니다. 자세한 내용은 계산식 저장소에서 확인하십시오.
• 곡선 적합 플랫폼에서는 다항식, 로지스틱, Gompertz, 지수, 정상점 및 약동학 모형과 같은 사전 정의된 모형을 제공합니다. 다양한 분석과 그래픽 기법을 사용하여 여러 그룹 또는 개체를 비교합니다. 자세한 내용은 곡선 적합에서 확인하십시오.
• 비선형 플랫폼을 사용하면 모형 계산식 및 추정할 모수가 포함된 사용자 비선형 모형을 적합시킬 수 있습니다. 자세한 내용은 비선형 회귀에서 확인하십시오.
• 가우시안 과정 플랫폼에서는 연속형 반응과 하나 이상의 연속형 예측 변수 간의 관계를 모델링합니다. 이러한 모형은 유한 요소 코드의 출력과 같은 컴퓨터 시뮬레이션 실험 분야에서 흔히 볼 수 있으며 데이터를 완벽하게 보간하는 경우가 많습니다. 자세한 내용은 가우시안 과정에서 확인하십시오.
•
함수 데이터 탐색기 플랫폼을 사용하면 함수 데이터를 다른 JMP 플랫폼에서 분석할 수 있는 형식으로 변환할 수 있습니다. 자세한 내용은 함수 데이터 탐색기에서 확인하십시오.
• 시계열 플랫폼을 사용하면 단변량 시계열을 탐색, 분석 및 예측할 수 있습니다. 자세한 내용은 시계열 분석에서 확인하십시오.
• 시계열 예측 플랫폼을 사용하면 다중 시계열을 모델링하고 예측할 수 있습니다. 최대 30개의 지수 평활 모형 집합에서 최량 적합 모형이 자동으로 선택됩니다. 자세한 내용은 시계열 예측에서 확인하십시오.
• 매칭 쌍 플랫폼에서는 상관관계가 있는 두 개 이상의 변수 간 평균을 비교하고 차이를 평가합니다. 자세한 내용은 매칭 쌍 분석에서 확인하십시오.
• 이상치 탐색 플랫폼을 사용하면 단변량 및 다변량 데이터 둘 다에서 이상치를 식별, 탐색 및 관리할 수 있습니다. 자세한 내용은 이상치 탐색에서 확인하십시오.
• 결측값 탐색 플랫폼은 데이터에서 결측값을 식별, 파악 및 대치할 수 있는 여러 가지 방법을 제공합니다. 자세한 내용은 결측값 탐색에서 확인하십시오.
• 패턴 탐색 플랫폼은 데이터에서 비정상적이거나 예기치 않은 패턴을 감지하는 데 사용됩니다. 자세한 내용은 패턴 탐색에서 확인하십시오.
• 반응 변수 선별 플랫폼에서는 다수의 반응 변수에 대한 검정 수행 과정을 자동화합니다. 검정 결과와 요약 통계량이 보고서 대신 데이터 테이블에 제공되어 데이터 탐색이 가능합니다. 자세한 내용은 반응 변수 선별에서 확인하십시오.
• 예측 변수 선별 플랫폼을 사용하면 유의한 예측 변수에 대한 데이터 집합을 선별할 수 있습니다. 자세한 내용은 예측 변수 선별에서 확인하십시오.
•
연관성 분석 플랫폼을 사용하면 서로 선호도가 있는 항목을 식별할 수 있습니다. 트랜잭션에서 자주 함께 나타나는 항목을 식별하기 위해 트랜잭션 데이터(장바구니라고도 함)를 분석하는 데 흔히 사용됩니다. 자세한 내용은 연관성 분석에서 확인하십시오.
• 공정 기록 탐색기 플랫폼을 사용하면 복잡한 공정 기록에서 문제를 일으키는 성분을 식별할 수 있습니다. 자세한 내용은 공정 기록 탐색기에서 확인하십시오.