발행일 : 03/10/2025

용어 및 구 목록

"텍스트 탐색기" 보고서의 "용어 및 구 목록" 섹션에는 토큰화 수행 후 텍스트에 있는 용어 및 구의 테이블이 포함됩니다. "용어 및 구 목록" 보고서의 예는 Figure 12.8에서 확인하십시오. 용어 목록의 "개수" 열은 말뭉치에서 각 용어가 나타난 횟수를 나타냅니다. 구 목록의 "개수" 열은 말뭉치에서 각 구가 나타난 횟수를 나타냅니다. "N" 열은 구 내의 단어 수를 나타냅니다.

기본적으로 용어 목록은 개수를 기준으로 내림차순 정렬되며, 개수가 동일한 용어들은 사전순으로 정렬됩니다. 구 목록은 개수를 기준으로 내림차순 정렬되며, 개수가 동일한 구들은 길이("N")를 기준으로 내림차순 정렬됩니다. 구 목록에서 길이도 동일한 구들은 사전순으로 정렬됩니다. 각 목록의 옵션을 사용하여 각 목록의 정렬 순서를 사전순으로 변경할 수 있습니다.

구 목록에 나타나는 구는 시작 창에 있는 구당 최대 단어 수최대 구 수 옵션의 설정에 따라 결정됩니다. 데이터 테이블에서 한 번만 나타나는 구는 구 목록에 표시되지 않습니다.

구는 다양한 범위에서 용어로 지정될 수 있습니다. 구 목록에서 용어로 지정된 구는 구의 규격 범위를 기준으로 색상이 지정됩니다(Table 12.1). 다양한 범위에서 구를 지정하는 방법에 대한 자세한 내용은 용어 옵션 관리 창에서 확인하십시오.

표 12.1 지정된 구의 색상

범위

색상

기본 제공

빨간색

사용자 라이브러리

녹색

프로젝트

파란색

열 특성

주황색

지역

회색

용어 및 구에 대한 작업

각 테이블의 맨 왼쪽 열에서 항목을 선택한 다음 마우스 오른쪽 버튼을 클릭하여 용어 목록 및 구 목록 테이블의 옵션에 액세스할 수 있습니다. 각 테이블의 "개수" 열을 마우스 오른쪽 버튼으로 클릭하고 "데이터 테이블로 만들기"를 선택하여 각 테이블을 데이터 테이블로 저장할 수 있습니다.

용어 목록 팝업 메뉴 옵션

용어 목록 테이블의 "용어" 열에서 마우스 오른쪽 버튼을 클릭하면 다음 옵션이 포함된 팝업 메뉴가 나타납니다.

행 선택하기

데이터 테이블에서 선택된 용어가 포함된 행을 선택합니다.

텍스트 표시

선택된 용어가 포함된 문서를 표시합니다.

참고: 기본적으로 처음 10,000개의 문서만 표시됩니다. 선택된 용어가 포함된 문서가 10,000개를 초과하면 이 한계를 늘릴 수 있는 창이 나타납니다.

사전순

용어 목록 정렬 순서를 지정합니다. 이 옵션을 선택하면 용어가 사전순으로 정렬됩니다. 이 옵션을 선택하지 않으면 용어가 개수 기준 내림차순으로 정렬됩니다.

수치 순서

("사전순" 옵션을 선택한 경우에만 사용할 수 있습니다.) 용어 목록 정렬 순서를 지정합니다. 이 옵션을 선택하면 항목이 문자열 및 숫자 세그먼트로 분할되고 숫자 세그먼트가 수치 순서로 정렬됩니다. "수치 순서" 옵션에서 사용되는 정렬 규칙에 대한 자세한 내용은 JMP 사용수치 순서에서 확인하십시오.

복사

선택된 용어를 클립보드에 추가합니다.

색상

선택된 용어에 색상을 할당할 수 있습니다.

라벨

선택된 용어에 대한 용어 SVD 그림의 해당 점에 라벨을 표시합니다.

포함하는 구

구 목록 테이블에서 선택된 용어가 포함된 구를 선택합니다.

표시자 저장

용어 목록에서 선택된 각 용어에 대한 표시자 열을 데이터 테이블에 저장합니다. 각 행의 표시자 열 값은 해당 행의 문서에 선택된 용어가 포함되어 있으면 1이고, 그렇지 않으면 0입니다.

계산식 저장

용어 목록에서 선택된 각 용어에 대한 열 계산식을 데이터 테이블에 저장합니다. 각 행의 열 계산식은 해당 행의 문서에 선택된 용어가 포함되어 있으면 1로 계산되고, 그렇지 않으면 0으로 계산됩니다. 이 옵션은 새 문서에 유용합니다.

재코딩

하나 이상의 용어에 대한 값을 변경할 수 있습니다. 이 옵션을 선택하기 전에 목록에서 용어를 선택해야 합니다. 이 옵션을 선택하면 "재코딩" 창이 나타납니다. 자세한 내용은 JMP 사용열의 데이터 재코딩에서 확인하십시오.

중지 단어 추가

선택된 용어를 중지 단어 목록에 추가하고 용어 목록에서 해당 용어를 제거합니다. 이 작업으로 구 목록도 업데이트됩니다.

참고: 어간 추출된 단어를 중지 단어로 추가하면 해당 어간과 일치하는 모든 토큰이 중지 단어로 추가됩니다.

어간 예외 추가

("언어" 옵션이 영어, 독일어, 스페인어, 프랑스어 또는 이탈리아어로 설정된 경우에만 사용 가능) 선택된 용어를 어간 추출에서 제외된 용어의 목록에 추가합니다.

구 제거

(지정된 구가 용어 목록에서 선택되고 "어간 추출" 방법이 "어간 추출 안 함"으로 선택된 경우에만 사용 가능) 지정된 구 집합에서 선택된 구를 제거하고 그에 따라 용어 개수를 업데이트합니다.

참고: 구가 감정 구로 추가된 경우 "구 제거" 옵션은 현재 감정 분석 보고서의 감정 용어 목록에서도 구를 제거합니다.

Image shown here감정 추가

(현재 보고서 창에 감정 분석 보고서가 열려 있는 경우에만 사용할 수 있습니다.) 선택한 용어를 현재 감정 분석 보고서의 감정 용어 목록에 추가합니다.

참고: 어간 추출된 단어를 감정 용어로 추가하면 해당 어간과 일치하는 모든 토큰이 감정 용어로 추가됩니다.

필터 표시

용어 목록 위에 검색 필터를 표시하거나 숨깁니다. 자세한 내용은 검색 필터 옵션에서 확인하십시오.

데이터 테이블로 만들기

보고서 테이블을 사용하여 JMP 데이터 테이블을 생성합니다.

결합 데이터 테이블 생성

보고서에서 선택한 테이블과 유사한 다른 테이블을 검색하여 단일 JMP 데이터 테이블에 결합합니다.

구 목록 팝업 메뉴 옵션

구 목록 테이블의 "구" 열에서 마우스 오른쪽 버튼을 클릭하면 다음 옵션이 포함된 팝업 메뉴가 나타납니다.

행 선택하기

데이터 테이블에서 선택된 구가 포함된 행을 선택합니다.

텍스트 표시

선택된 구가 포함된 문서를 표시합니다.

표시자 저장

구 목록에서 선택된 각 구에 대한 표시자 열을 데이터 테이블에 저장합니다. 각 행의 표시자 열 값은 해당 행의 문서에 선택된 구가 포함되어 있으면 1이고, 그렇지 않으면 0입니다.

사전순

구 목록 정렬 순서를 지정합니다. 이 옵션을 선택하면 용어가 사전순으로 정렬됩니다. 이 옵션을 선택하지 않으면 용어가 개수 기준 내림차순으로 정렬됩니다.

수치 순서

("사전순" 옵션을 선택한 경우에만 사용할 수 있습니다.) 구 목록 정렬 순서를 지정합니다. 이 옵션을 선택하면 항목이 문자열 및 숫자 세그먼트로 분할되고 숫자 세그먼트가 수치 순서로 정렬됩니다. "수치 순서" 옵션에서 사용되는 정렬 규칙에 대한 자세한 내용은 JMP 사용수치 순서에서 확인하십시오.

복사

선택된 구를 클립보드에 추가합니다.

포함하는 항목 선택

구 목록에서 선택된 구를 포함하는 더 큰 구를 선택합니다.

포함된 항목 선택

구 목록 및 용어 목록에서 선택된 구에 포함된 더 작은 구 및 용어를 선택합니다.

구 추가

선택된 구를 용어 목록에 추가하고 그에 따라 용어 개수를 업데이트합니다.

중지 단어 추가

선택된 구를 중지 단어 목록에 추가합니다. 이 작업으로 용어 목록도 업데이트됩니다.

Image shown here감정 구 추가

(현재 보고서 창에 감정 분석 보고서가 열려 있는 경우에만 사용할 수 있습니다.) 선택한 구를 용어 목록 및 현재 "감정 분석" 보고서의 감정 용어 목록에 추가합니다.

필터 표시

구 목록 위에 검색 필터를 표시하거나 숨깁니다. 자세한 내용은 검색 필터 옵션에서 확인하십시오.

데이터 테이블로 만들기

보고서 테이블을 사용하여 JMP 데이터 테이블을 생성합니다.

결합 데이터 테이블 생성

보고서에서 선택한 테이블과 유사한 다른 테이블을 검색하여 단일 JMP 데이터 테이블에 결합합니다.

검색 필터 옵션

검색 상자 옆의 아래쪽 화살표 버튼을 클릭하여 검색을 구체화할 수 있습니다.

용어 포함

검색 기준의 일부가 포함된 항목을 반환합니다. "ease oom"을 검색하면 "Release Zoom"과 같은 메시지가 반환됩니다.

구 포함

검색 기준이 정확히 포함된 항목을 반환합니다. "text box"를 검색하면 "text"와 "box"가 바로 연이어 포함된 항목(예: "Context Box" 및 "Text Box")이 반환됩니다.

구로 시작

검색 기준으로 시작하는 항목을 반환합니다.

구로 끝남

검색 기준으로 끝나는 항목을 반환합니다.

전체 구

전체 문자열로 구성된 항목을 반환됩니다. "text box"를 검색하면 "text box"만 포함된 항목이 반환됩니다.

정규 표현식

검색 상자에서 와일드카드(*)와 마침표(.)를 사용할 수 있습니다. "get.*name"을 검색하면 "get" 다음에 하나 이상의 단어가 포함된 항목을 찾을 수 있습니다. 즉, "Get Color Theme Names", "Get Name Info" 및 "Get Effect Names" 등이 반환됩니다.

결과 반전

검색 기준과 매칭되지 않는 항목을 반환합니다.

모든 용어 일치

문자열이 모두 포함된 항목을 반환합니다. "t test"를 검색하면 검색 문자열 중 하나 또는 둘 모두가 포함된 요소(예: "Pat Test", "Shortest Edit Script" 및 "Paired t test")가 반환됩니다.

대/소문자 무시

검색 기준의 대/소문자를 무시합니다.

전체 단어 일치

"모든 용어 일치" 설정에 따라 문자열의 각 단어가 포함된 항목을 반환합니다. "모든 용어 일치" 옵션이 선택되어 있는 경우 "data filter"를 검색하면 "data"와 "filter"가 반환됩니다.

더 많은 정보를 원하십니까? 질문이 있습니까? JMP 사용자 커뮤니티에서 답변 받기 (community.jmp.com).