연관성 분석 플랫폼의 예이 예에서는 식료품점에서 보고한 트랜잭션 데이터를 사용합니다. 1001명의 고객이 구매한 품목에 대해 소비자 행동 패턴을 식별하기 위해 항목 간의 연관성을 탐색하려고 합니다.
1. 도움말 > 샘플 데이터 폴더를 선택하고 Grocery Purchases.jmp를 엽니다.
2. 분석 > 선별 > 연관성 분석을 선택합니다.
3. Product를 선택하고 항목을 클릭합니다.
4. Customer ID를 선택하고 ID를 클릭합니다.
참고: 1001명의 각 고객에 대해 고유한 사용자 ID가 할당됩니다.
5. 확인을 클릭합니다.
기본적으로 "규칙" 보고서는 신뢰도에 따라 내림차순으로 정렬됩니다. 그러나 신뢰도가 매우 높은 연관 규칙은 조건 집합의 항목 수가 많은 더 경향도 있습니다. 더 작은 조건 집합의 연관 규칙을 검토할 예정이므로 보고서를 신뢰도에 따라 오름차순으로 정렬합니다.
6. "규칙" 보고서에서 마우스 오른쪽 버튼을 클릭하고 열별 정렬을 선택합니다.
"열 선택" 창이 나타납니다.
7. 신뢰도를 선택한 후 "오름차순" 옵션을 선택합니다.
8. 확인을 클릭합니다.
그림 26.2 연관성 분석 보고서
9. 신뢰도 값 "58%"가 나올 때까지 보고서를 아래로 스크롤합니다.
"규칙" 보고서 테이블에 avocado(아보카도)를 구입한 고객의 58%가 artichoke(아티초크)도 구입했음을 나타내는 항목이 있습니다. "향상도" 값은 1.908로, 종속성 가능성이 있음을 나타냅니다. 트랜잭션에서 아보카도와 아티초크가 발생하는 비율이 유의한지 확인하려고 합니다.
10. "빈발 항목 집합" 옆의 표시 아이콘을 클릭합니다.
그림 26.3 빈발 항목 집합 보고서
"빈발 항목 집합" 보고서에 따르면 고객의 36%가 아보카도를 구입했습니다. Figure 26.2의 "규칙" 보고서에서는 이러한 고객의 58%가 아티초크도 구입했음을 보여 줍니다. 이 행동을 보이는 고객의 비율이 높기 때문에 식료품점 관리자는 이 정보를 사용하여 아보카도와 아티초크를 전략적으로 배치할 수 있습니다.
향상도가 가장 높은 연관 규칙도 살펴보려고 합니다.
11. "규칙" 보고서 테이블에서 마우스 오른쪽 버튼을 클릭하고 열별 정렬을 선택합니다.
"열 선택" 창이 나타납니다.
12. 향상도를 선택하고 확인을 클릭합니다.
"규칙" 테이블이 향상도 값에 따라 내림차순으로 정렬됩니다. 두 번째 연관 규칙은 향상도가 5.642이고 신뢰도가 83%입니다. 조건 집합 {chicken, ice cream}과 결과 항목 집합 {Coke, sardines} 모두 지지도가 적절한지 확인하려고 합니다.
13. "빈발 항목 집합" 보고서에서 마우스 오른쪽 버튼을 클릭하고 열별 정렬을 선택합니다.
"열 선택" 창이 나타납니다.
14. 항목 집합을 선택하고 "오름차순" 옵션을 선택합니다.
15. 확인을 클릭합니다.
"빈발 항목 집합" 테이블이 항목 집합에 따라 사전순으로 정렬됩니다. 목록을 스크롤하여 조건 항목 집합 {chicken, ice cream}의 지지도가 14%인지 확인합니다. 결과 항목 집합 {Coke, sardines}의 지지도는 15%입니다. 이 연관 규칙은 향상도 값이 높지만 첫 번째로 검토한 연관 규칙보다 트랜잭션 수가 적음을 나타냅니다.