발행일 : 03/10/2025

Image shown here주제 분석

텍스트 탐색기 플랫폼의 "주제 분석, 회전된 SVD" 옵션은 DTM(문서 용어 행렬)의 부분 SVD(특이값 분해)에 대해 Varimax 회전을 수행합니다. DTM에서 유지할 주제의 개수에 해당하는 회전 특이 벡터의 수를 지정해야 합니다. 주제 수를 지정하면 주제 분석 보고서가 나타납니다.

주제 분석은 회전 PCA(주성분 분석)와 동등합니다. Varimax 회전은 여러 개의 특이 벡터를 구하고 이를 회전시켜 더 직접적으로 좌표 방향(용어 방향)을 향하게 합니다. 이렇게 회전하면 각 회전 벡터가 용어 집합을 향하므로 텍스트를 설명하는 데 도움이 됩니다. 음수 값은 반발력을 나타냅니다. 음수 값을 갖는 용어는 양수 값을 갖는 용어에 비해 주제에 나타나는 빈도가 낮습니다.

Image shown here주제 분석 보고서

텍스트 탐색기 플랫폼의 "주제 분석" 보고서에서는 회전 후 각 주제에서 적재량이 가장 큰 용어를 보여 줍니다. 추가 보고서에서는 회전된 특이값 분해의 성분을 보여 줍니다.

"주제별 상위 적재" 보고서에서는 각 주제의 용어 테이블을 보여 줍니다. 각 테이블의 용어는 각 주제에 대한 적재량 절대값이 가장 큰 용어입니다. 각 테이블은 적재량 절대값을 기준으로 내림차순 정렬되어 있습니다. 이러한 테이블을 사용하여 각 주제에 해당하는 개념 테마를 판별할 수 있습니다.

주제 분석 보고서에는 다음 보고서도 포함됩니다.

주제 적재

각 용어의 주제 간 적재량 행렬이 포함됩니다. 이 행렬은 회전 PCA의 요인 적재 행렬과 동등합니다.

주제별 단어 클라우드

각 주제당 하나씩의 단어 클라우드가 포함됩니다.

주제 스코어

각 주제의 문서 스코어 행렬이 포함됩니다. 주제 스코어가 높은 문서는 해당 주제와 연관성이 있을 가능성이 높습니다.

주제 스코어 그림

"텍스트 표시" 버튼과 각 문서의 주제 스코어 그림이 포함됩니다. "텍스트 표시" 버튼을 클릭하면 선택한 문서의 텍스트가 포함된 창이 열립니다.

"주제 스코어 그림" 보고서는 주제 스코어 보고서의 행렬을 시각적으로 나타낸 것입니다. 그림의 각 패널은 주제 중 하나, 또는 주제 스코어 행렬의 열 중 하나에 해당합니다. 각 패널 내에서 각 점은 말뭉치의 문서 중 하나, 또는 주제 스코어 행렬의 행 중 하나에 해당합니다.

각 주제에 의해 설명된 분산

각 주제에 의해 설명되는 분산의 테이블이 포함됩니다. 이 테이블에는 각 주제에 의해 설명되는 변동이 백분율 또는 누적 백분율에 대한 열도 포함됩니다.

회전 행렬

Varimax 회전에 대한 회전 행렬이 포함됩니다.

Image shown here주제 분석 보고서 옵션

텍스트 탐색기 플랫폼에서 "주제 분석"의 빨간색 삼각형 메뉴에는 다음 옵션이 포함되어 있습니다.

주제 산점도 행렬

회전된 특이값 분해 벡터에 대한 산점도 행렬을 표시하거나 숨깁니다. "텍스트 표시" 버튼을 클릭하면 선택한 문서의 텍스트가 포함된 창이 열립니다.

표시 옵션

주제 분석 보고서에 나타나는 내용을 표시하거나 숨기기 위한 옵션이 포함되어 있습니다. 자세한 내용은 주제 분석 보고서에서 확인하십시오.

주제 이름 바꾸기

하나 이상의 주제에 대한 이름을 추가할 수 있습니다.

문서 주제 벡터 저장

회전 특이값 분해에서 구한 특이 벡터 중 사용자가 지정한 수만큼을 데이터 테이블에 열로 저장합니다.

주제 벡터 계산식 저장

회전된 특이값 분해를 포함하는 벡터 모델링 유형의 계산식 열을 데이터 테이블에 저장합니다. 결과 열에는 Text Score() JSL 함수가 사용됩니다. 이 함수에 대한 자세한 내용은 도움말 > 스크립트 인덱스에서 확인하십시오.

용어 주제 벡터 저장

주제 벡터를 "용어 테이블 저장" 옵션으로 생성된 데이터 테이블에 열로 저장합니다.

제거

SVD 보고서에서 주제 분석 보고서를 제거합니다.

더 많은 정보를 원하십니까? 질문이 있습니까? JMP 사용자 커뮤니티에서 답변 받기 (community.jmp.com).