예측 및 전문 모델링 > 연관성 분석 > 연관성 분석 플랫폼의 추가 예
발행일 : 03/10/2025

Image shown here연관성 분석 플랫폼의 추가 예

이 예에서는 트랜잭션 항목 행렬의 특이값 분해를 사용하여 식료품점에서 보고한 트랜잭션 데이터를 분석합니다. 데이터에는 1001명의 고객이 구매한 품목에 대한 정보가 포함되어 있습니다.

1. 도움말 > 샘플 데이터 폴더를 선택하고 Grocery Purchases.jmp를 엽니다.

2. 분석 > 선별 > 연관성 분석을 선택합니다.

3. Product를 선택하고 항목을 클릭합니다.

4. Customer ID를 선택하고 ID를 클릭합니다.

참고: 1001명의 각 고객에 대해 고유한 사용자 ID가 할당됩니다.

5. 확인을 클릭합니다.

6. "연관성 분석"의 빨간색 삼각형을 클릭하고 SVD를 선택합니다.

7. 확인을 클릭합니다.

그림 26.5 SVD 그림 

SVD Plots

트랜잭션 SVD 그림은 두 개 또는 세 개의 트랜잭션 그룹이 있을 수 있음을 나타냅니다. 항목 SVD 그림의 오른쪽 위에 Coke(콜라)와 ice cream(아이스크림)을 나타내는 점이 중첩되어 있습니다. 이 두 항목의 근접성은 두 항목 간에 강한 선호도가 있음을 나타냅니다.

8. "SVD"의 빨간색 삼각형을 클릭하고 주제 분석, 회전된 SVD를 선택합니다.

9. "주제 수(회전된 특이 벡터)" 옆에 "3"을 입력하고 확인을 클릭합니다.

주제 항목 및 주제 스코어 보고서가 나타납니다.

그림 26.6 주제 항목 보고서 

Topic Items Report

세 개의 그룹 또는 주제가 생성되어 주제 항목 보고서에 표시됩니다. 주제 항목 테이블에 나열된 첫 번째 항목은 해당 그룹의 기본 항목을 나타냅니다. 예를 들어 "주제 1"은 avocado(아보카도)를 포함하지 않지만 olives(올리브)를 포함하는 트랜잭션으로 주로 식별되는 그룹입니다.

그림 26.7 주제 스코어 

Topic Scores

1001개의 각 트랜잭션에 할당된 주제 스코어가 "주세 스코어" 보고서에 표시됩니다. 해당 트랜잭션이 다른 주제와 어떤 관련이 있는지 보려면 주제에 대한 점 그룹을 선택합니다. 예를 들어 주제 1에서 값이 매우 높은 트랜잭션이 주제 2와 3에서는 값이 낮은 경향이 있습니다.

10. "특이값" 보고서를 엽니다.

그림 26.8 특이값 테이블 

Singular Values Table

Figure 26.8에서 알 수 있듯이 처음 두 특이값은 식료품점 데이터의 변동을 약 30%만 설명합니다. 변동을 충분히 설명하려면 다른 차원이 더 필요할 수 있습니다.

더 많은 정보를 원하십니까? 질문이 있습니까? JMP 사용자 커뮤니티에서 답변 받기 (community.jmp.com).