예측 및 전문 모델링 > 연관성 분석 > 연관성 분석 플랫폼 개요
발행일 : 03/10/2025

Image shown here연관성 분석 플랫폼 개요

연관성 분석 플랫폼에서는 독립 사건 또는 트랜잭션에서 항목 그룹 간의 연관성을 식별합니다. 연관성 분석에서 항목은 기본 관심 대상입니다. 예를 들어 항목은 제품, 웹 페이지 또는 서비스일 수 있습니다. 항목 집합은 하나 이상의 항목 목록입니다.

두 항목 집합 간의 관계는 연관 규칙으로 정의됩니다. 연관 규칙은 조건 항목 집합과 결과 항목 집합으로 구성됩니다. 선행 항목은 조건 항목 집합의 개별 항목입니다. 연관성 분석은 조건 항목 집합이 이미 트랜잭션에 있는 경우 결과 항목 집합이 트랜잭션에 있을 것으로 예측하는 연관 규칙을 식별합니다. 일부 연관 규칙은 다른 규칙보다 더 강력하므로 더 유용합니다. 다음과 같은 세 가지 성능 측도로 연관 규칙 강도를 설명합니다.

지지도는 항목 집합이 나타나는 트랜잭션의 비율입니다. 지지도 값이 높으면 해당 항목 집합이 자주 발생한다는 것을 나타냅니다.

신뢰도는 트랜잭션에 조건 항목 집합이 있을 때 결과 항목 집합을 포함하는 트랜잭션의 비율입니다. 신뢰도는 연관 규칙의 영향력 또는 예측 검정력을 측정합니다. 연관성 분석의 신뢰도는 신뢰 구간의 개념과 관련이 없습니다.

향상도는 조건 항목 집합과 결과 항목 집합이 트랜잭션에서 독립적으로 발생한다고 가정할 때 기대 신뢰도에 대한 연관 규칙 신뢰도의 비율입니다. 향상도는 조건 항목 집합이 있는지 여부에 따라 결과 항목 집합이 얼마나 달라지는지 측정합니다. 향상도 최소값은 0입니다.

향상도 비율이 1보다 작으면 조건과 결과가 함께 발생하는 빈도가 우연히 발생할 경우보다 낮으므로 서로 밀어낸다는 것을 나타냅니다.

향상도 비율이 1에 가까우면 결과가 조건이 포함된 트랜잭션에서 발생하는 비율이 우연히 발생할 비율과 같음을 나타냅니다.

향상도 비율이 1보다 크면 결과 항목 집합에 조건 항목 집합에 대한 선호도가 있음을 나타냅니다. 결과 항목 집합은 우연히 발생하는 것보다 조건 항목 집합과 함께 발생할 빈도가 더 높습니다.

이러한 성능 측도에 대한 자세한 내용은 성능 측도에 대한 통계 상세 정보에서 확인하십시오.

연관성 분석 플랫폼을 사용하면 특이값 분해도 수행할 수 있습니다. SVD(특이값 분해)는 연관성 분석에 사용되는 것과 다른 행렬 축소 방법론을 사용하여 유사한 트랜잭션 및 유사한 항목을 그룹화합니다. 연관성 분석에서 얻은 결과를 보완하는 정보를 제공하려면 SVD 방법론을 사용합니다.

연관성 분석에 대한 자세한 내용은 Hastie et al. (2009) 및 Shmueli et al. (2010)에서 확인하십시오. 특이값 분해에 대한 자세한 내용은 Jolliffe(2002) 연구 자료에서 확인하십시오.

더 많은 정보를 원하십니까? 질문이 있습니까? JMP 사용자 커뮤니티에서 답변 받기 (community.jmp.com).