텍스트 분석 옵션텍스트 탐색기의 빨간색 삼각형 메뉴에는 분석을 위한 다음 옵션이 포함되어 있습니다.
잠재 계층 분석
희소 행렬 루틴을 사용하여 이진 가중 문서 용어 행렬에 대해 잠재 계층 분석을 수행합니다. 자세한 내용은 잠재 계층 분석에서 확인하십시오.
텍스트 탐색기의 빨간색 삼각형 메뉴에서 "잠재 계층 분석"을 선택하면 다음 옵션이 포함된 규격 창이 나타납니다.
최대 용어 수
잠재 계층 분석에 포함되는 용어의 최대 개수입니다.
최소 용어 빈도
한 용어가 잠재 계층 분석에 포함되기 위해 충족해야 하는 최소 발생 횟수입니다.
군집 수
잠재 계층 분석의 군집 수입니다.
잠재 의미 분석, SVD
문서 용어 행렬의 부분 특이값 분해를 수행합니다. 자세한 내용은 잠재 의미 분석(SVD)에서 확인하십시오.
판별 분석
문서 용어 행렬을 기준으로 그룹 또는 범주에서 각 문서의 소속을 예측합니다. 자세한 내용은 판별 분석에서 확인하십시오.
용어 선택
서로 다른 응답을 가장 잘 설명하는 용어를 분석합니다. 용어 선택은 응답이 평가인 경우 감정 분석에도 유용할 수 있습니다. 자세한 내용은 용어 선택에서 확인하십시오.
감정 분석
("언어" 옵션이 영어로 설정된 경우에만 사용할 수 있습니다.) 어휘 분석을 사용하여 문서에서 감정 용어를 식별하고 긍정, 부정 및 전반적 감정에 대해 문서를 스코어링합니다. 자세한 내용은 감정 분석에서 확인하십시오.
특이값 분해 규격 창텍스트 탐색기 플랫폼의 분석 옵션은 DTM(문서 용어 행렬)을 기반으로 합니다. DTM은 용어 목록에 있는 각 용어에 대한 열을 생성하여 구성됩니다("최대 용어 수"에 지정된 개수까지). 각 텍스트 문서(데이터 테이블의 행과 동등)는 DTM의 한 행에 해당합니다. DTM의 셀 값은 "규격" 창에서 사용자가 지정한 가중 유형에 따라 달라집니다.
Figure 12.10에서는 특이값 분해를 위한 "규격" 창을 보여 줍니다. 텍스트 탐색기의 빨간색 삼각형 메뉴에서 문서 용어 행렬에 대해 특이값 분해를 수행하는 옵션을 선택하면 다음 옵션이 포함된 "규격" 창이 나타납니다.
최대 용어 수
특이값 분해에 포함되는 용어의 최대 개수입니다.
최소 용어 빈도
한 용어가 특이값 분해에 포함되기 위해 충족해야 하는 최소 발생 횟수입니다.
가중치
문서 용어 행렬의 셀에 들어갈 값을 결정하는 가중치 체계입니다. 가중치 체계 옵션에 대한 자세한 내용은 문서 용어 행렬 규격 창에서 확인하십시오.
특이 벡터 수
특이값 분해의 특이 벡터 수입니다. 기본값은 문서 수, 용어 수 또는 100 중 최소값입니다.
중심화 및 척도화
문서 용어 행렬을 중심화하고 척도화하기 위한 옵션입니다. 중심화 및 척도화, 중심화 및 비중심화 중에서 선택할 수 있습니다. 기본적으로 문서 용어 행렬은 중심화되고 척도화됩니다.
그림 12.10 SVD 규격 창