발행일 : 03/10/2025

잠재 계층 분석

텍스트 탐색기 플랫폼에서 잠재 계층 분석을 통해 말뭉치의 문서를 유사 문서의 군집으로 그룹화할 수 있습니다. 잠재 계층 분석 보고서에는 모형 규격, 모형에 대한 BIC(베이지안 정보 기준) 값, 그리고 "텍스트 표시" 버튼이 포함됩니다. "군집 혼합 확률" 테이블에서 하나 이상의 군집을 선택하고 "텍스트 표시" 버튼을 클릭하면 선택한 군집에 속할 가능성이 가장 높은 문서의 텍스트가 포함된 창이 열립니다.

"잠재 계층 분석"의 빨간색 삼각형 메뉴에는 다음 옵션이 포함되어 있습니다.

표시 옵션

"잠재 계층 분석" 보고서의 내용을 지정합니다. 기본적으로는 각 군집의 단어 클라우드를 제외한 모든 보고서 옵션이 표시됩니다.

군집 혼합 확률

관측값이 각 군집에 속할 확률을 보여 주는 테이블을 표시하거나 숨깁니다.

팁: "군집별 혼합 확률" 테이블에서 하나 이상의 행을 선택하여 해당 군집에 할당된 관측값을 선택할 수 있습니다.

군집별 용어 확률

문서가 특정 군집에 속할 경우 군집별로 문서에 용어가 포함될 조건부 확률의 추정값이 들어 있는 용어 테이블을 표시하거나 숨깁니다. 기본적으로 이 테이블의 용어는 말뭉치에서의 빈도를 기준으로 내림차순 정렬됩니다.

"가장 특징적인 군집" 열에는 각 용어가 가장 높은 비율로 발생하는 군집이 표시됩니다.

"가장 확률이 높은 군집" 열에는 각 용어가 포함된 문서 중에서 무작위로 선택된 문서가 발견될 확률이 가장 높은 군집이 표시됩니다.

군집별 상위 용어

각 군집에서 스코어가 가장 높은 10개 용어의 테이블을 표시하거나 숨깁니다. 군집 c의 용어 t에 대한 스코어 St,c는 다음과 같이 계산됩니다.

Equation shown here

여기서 mean(pt)는 용어 t의 군집별 평균 용어 확률이고, pt,c는 군집 c의 용어 t에 대한 군집별 용어 확률입니다.

MDS 그림

군집의 근접성을 2차원으로 표현한 다차원 척도 그림을 표시하거나 숨깁니다. MDS 그림에 대한 자세한 내용은 다변량 방법의 다차원 척도법에서 확인하십시오. "텍스트 표시" 버튼을 클릭하면 선택한 문서의 텍스트가 포함된 창이 열립니다.

행별 군집 확률

각 행의 군집 소속 확률을 표시하는 혼합 확률 테이블을 표시하거나 숨깁니다. "최대 확률 분류 군집"은 각 행의 소속 확률이 가장 높은 군집을 나타냅니다.

군집별 단어 클라우드

단어 클라우드를 군집당 하나씩 포함하는 행렬을 표시하거나 숨깁니다.

군집 이름 바꾸기

하나 이상의 군집에 대한 이름을 추가할 수 있습니다.

확률 저장

"혼합 확률" 테이블의 값을 데이터 테이블의 해당 행에 저장합니다.

확률 계산식 저장

각 군집에 대한 계산식 열과 최대 확률 분류 군집에 대한 계산식 열을 데이터 테이블에 저장합니다.

저장되는 스코어 계산식에서는 가중치 인수를 "LCA"로 설정하고 Text Score() JSL 함수를 사용합니다.

군집별 색상

데이터 테이블의 각 행을 최대 확률 분류 군집에 따라 색상을 적용합니다.

제거

"텍스트 탐색기" 보고서에서 "잠재 계층 분석" 보고서를 제거합니다.

잠재 계층 분석에 대한 자세한 내용은 다변량 방법의 잠재 계층 분석에서 확인하십시오.

참고: 텍스트 탐색기 플랫폼에서 사용되는 LCA 알고리즘은 문서 용어 행렬의 희소성을 활용합니다. 이러한 이유로 텍스트 탐색기 플랫폼의 LCA 결과는 잠재 계층 분석 플랫폼의 결과와 정확하게 매칭되지 않습니다.

더 많은 정보를 원하십니까? 질문이 있습니까? JMP 사용자 커뮤니티에서 답변 받기 (community.jmp.com).