텍스트 탐색기의 빨간색 삼각형 메뉴에는 텍스트 준비를 위한 다음 옵션이 포함되어 있습니다.
표시 옵션
보고서 표시를 제어하는 옵션의 하위 메뉴를 표시합니다.
단어 클라우드 표시
"단어 클라우드" 보고서를 표시하거나 숨깁니다. "단어 클라우드"의 빨간색 삼각형 메뉴를 사용하여 단어 클라우드의 레이아웃 및 글꼴을 변경할 수 있습니다. 자세한 내용은 단어 클라우드 옵션에서 확인하십시오.
너비를 변경하는 방법으로 단어 클라우드의 크기를 대화식으로 조정할 수 있습니다. 이때 높이는 자동으로 결정됩니다. 용어 목록의 행은 단어 클라우드의 용어에 연결됩니다.
용어 목록 표시
용어 목록 보고서를 표시하거나 숨깁니다.
구 목록 표시
구 목록 보고서를 표시하거나 숨깁니다.
용어 및 구 옵션 표시
"용어 및 구 목록" 보고서에서 각 목록의 팝업 메뉴에서 사용할 수 있는 옵션에 해당하는 버튼을 표시하거나 숨깁니다. 자세한 내용은 용어 및 구 목록에서 확인하십시오.
요약 개수 표시
요약 개수 테이블을 표시하거나 숨깁니다. 자세한 내용은 요약 개수 보고서에서 확인하십시오.
중지 단어 표시
분석에 사용된 중지 단어의 목록을 표시하거나 숨깁니다. 처음에는 기본 제공 중지 단어 목록이 사용됩니다. 중지 단어를 추가하려면 용어 목록 보고서를 마우스 오른쪽 버튼으로 클릭한 후 팝업 메뉴에서 중지 단어 추가를 선택합니다. 자세한 내용은 용어 옵션 관리 창에서 확인하십시오.
재코딩 표시
재코딩된 용어의 목록을 표시하거나 숨깁니다. 자세한 내용은 용어 옵션 관리 창에서 확인하십시오.
지정한 구 표시
사용자가 용어로 처리되도록 지정한 구의 목록을 표시하거나 숨깁니다. 자세한 내용은 용어 옵션 관리 창에서 확인하십시오.
어간 예외 표시
("언어" 옵션이 영어, 독일어, 스페인어, 프랑스어 또는 이탈리아어로 설정된 경우에만 사용 가능) 어간 추출에서 제외된 용어를 표시하거나 숨깁니다. 자세한 내용은 용어 옵션 관리 창에서 확인하십시오.
구분자 표시
("언어" 옵션이 영어, 독일어, 스페인어, 프랑스어 또는 이탈리아어로 설정되고 선택된 토큰화 방법이 "기본 단어"인 경우에만 사용 가능) 기본 단어 토큰화 방법에 사용된 구분자를 표시하거나 숨깁니다 사용된 구분자 집합을 수정하려면 JSL에서 Add Delimiters() 또는 Set Delimiters() 메시지를 사용해야 합니다.
어간 보고서 표시
("언어" 옵션이 영어, 독일어, 스페인어, 프랑스어 또는 이탈리아어로 설정되고 선택된 어간 추출 방법이 "어간 추출 안 함"인 경우에만 사용 가능) 두 개의 어간 추출 결과 테이블이 포함된 "어간 추출" 보고서를 표시하거나 숨깁니다. 왼쪽의 테이블은 각 어간을 해당 용어에 매핑합니다. 오른쪽의 테이블은 각 용어를 해당 어간에 매핑합니다.
선택된 행 표시
현재 선택된 행에 있는 문서의 텍스트가 포함된 창을 엽니다.
모든 테이블에 대해 필터 표시
보고서의 테이블을 검색하는 데 사용할 수 있는 필터를 표시하거나 숨깁니다. 이 옵션은 중지 단어, 지정된 구, 어간 예외, 용어 목록, 구 목록 및 어간 보고서에 적용됩니다. 필터 도구에 대한 자세한 내용은 검색 필터 옵션에서 확인하십시오.
용어 옵션
용어 목록 보고서에 적용되는 옵션 하위 메뉴를 표시합니다.
어간 추출
("언어" 옵션이 영어, 독일어, 스페인어, 프랑스어 또는 이탈리아어로 설정된 경우에만 사용 가능) 어간 추출 옵션에 대한 자세한 내용은 텍스트 탐색기 플랫폼 시작에서 확인하십시오.
기본 제공 중지 단어 포함
토큰화 프로세스에 사용되는 중지 단어에 기본 제공 중지 단어를 포함할지 여부를 지정합니다.
기본 제공 구 포함
토큰화 프로세스에 사용되는 구에 기본 제공 구를 포함할지 여부를 지정합니다.
중지 단어 관리
중지 단어를 추가하거나 제거할 수 있는 창을 표시합니다. 변경 사항은 사용자, 열 및 지역 수준에서 적용될 수 있습니다. 다른 수준에 지정된 중지 단어를 제외하는 지역 예외를 지정할 수도 있습니다. 자세한 내용은 용어 옵션 관리 창에서 확인하십시오.
재코딩 관리
재코딩을 추가하거나 제거할 수 있는 창을 표시합니다. 변경 사항은 사용자, 열 및 지역 수준에서 적용될 수 있습니다. 다른 수준에 지정된 재코딩을 제외하는 지역 예외를 지정할 수도 있습니다. 자세한 내용은 용어 옵션 관리 창에서 확인하십시오.
구 관리
용어로 처리되는 구를 추가하거나 제거할 수 있는 창을 표시합니다. 변경 사항은 사용자, 열 및 지역 수준에서 적용될 수 있습니다. 다른 수준에 지정된 구를 제외하는 지역 예외를 지정할 수도 있습니다. 자세한 내용은 용어 옵션 관리 창에서 확인하십시오.
어간 예외 관리
("언어" 옵션이 영어, 독일어, 스페인어, 프랑스어 또는 이탈리아어로 설정된 경우에만 사용 가능) 어간 추출 예외를 추가하거나 제거할 수 있는 창을 표시합니다. 변경 사항은 사용자, 열 및 지역 수준에서 적용될 수 있습니다. 다른 수준에 지정된 어간 예외를 제외하는 지역 예외를 지정할 수도 있습니다. 자세한 내용은 용어 옵션 관리 창에서 확인하십시오.
파싱 옵션
파싱 및 토큰화에 적용되는 옵션의 하위 메뉴를 표시합니다.
토큰화
("언어" 옵션이 영어, 독일어, 스페인어, 프랑스어 또는 이탈리아어로 설정된 경우에만 사용 가능) 토큰화 옵션에 대한 자세한 내용은 텍스트 탐색기 플랫폼 시작에서 확인하십시오.
정규 표현식 사용자 정의
(정규 표현식 토큰화 방법을 사용하는 경우에만 사용 가능) "정규 표현식 사용자 정의" 창을 표시합니다. 이 옵션을 사용하여 현재 텍스트 탐색기 보고서에 대한 정규 표현식 설정을 수정할 수 있습니다.
참고: 플랫폼 시작 창에서 기준 변수를 지정한 경우에는 "정규 표현식 사용자 정의" 옵션이 기준 변수의 모든 수준에 일괄 적용됩니다.
숫자를 단어로 처리
("언어" 옵션이 영어, 독일어, 스페인어, 프랑스어 또는 이탈리아어로 설정되고 선택된 토큰화 방법이 "기본 단어"인 경우에만 사용 가능) 분석에서 숫자를 용어로 토큰화할 수 있도록 합니다. 이 옵션은 단어당 최소 문자 수에 대한 설정에 따라 영향을 받습니다.
"단어 클라우드"의 빨간색 삼각형 메뉴에는 다음 옵션이 포함되어 있습니다.
레이아웃
단어 클라우드에서 용어의 배열을 지정합니다. 기본 레이아웃은 "정렬됨"으로 설정되어 있습니다.
정렬됨
용어를 빈도가 높은 것부터 낮은 것 순서로 가로 줄로 표시합니다.
사전순
용어를 오름차순 사전순으로 정렬하여 가로 줄로 표시합니다.
중심화
용어를 빈도에 따른 크기로 클라우드에 표시합니다.
색상 적용
단어 클라우드에서 용어의 색상을 지정합니다. 기본 색상은 "없음"으로 설정되어 있습니다.
없음
각 용어를 용어 목록의 색상과 동일한 색상으로 표시합니다.
균등 색상
각 용어를 동일한 색상으로 표시합니다. 범례에서 이 색상을 변경할 수 있습니다.
임의 회색
각 용어를 다양한 회색 음영으로 표시합니다.
임의 색상
각 용어를 다양한 색상으로 표시합니다. 범례에서 색상을 조정할 수 있습니다.
열 값별
각 용어를 그래디언트 색상 척도로 표시합니다. 척도는 "열을 기준으로 용어 스코어링" 옵션으로 생성된 용어 스코어를 기준으로 합니다. 범례에서 색상과 그래디언트를 조정할 수 있습니다.
글꼴
단어 클라우드에서 용어의 글꼴, 스타일 및 크기를 지정합니다.
범례 표시
단어 클라우드에 대한 범례를 표시하거나 숨깁니다.
다양한 범위에 대해 중지 단어, 재코딩, 구 및 어간 예외 정보를 지정할 수 있습니다. 이러한 정보는 텍스트 탐색기 사용자 라이브러리(사용자 범위), 현재 프로젝트, 분석 열에 대한 열 특성(열 범위) 또는 플랫폼 스크립트(지역 범위)에 저장할 수 있습니다. 텍스트 탐색기 보고서의 스크립트를 저장하여 특정 텍스트 탐색기 인스턴스에 대한 지역 규격 및 지역 예외를 저장할 수 있습니다.
용어 옵션 관리 창은 중지 단어, 재코딩, 구 및 어간 예외의 모음을 관리할 수 있는 네 가지 유사한 창입니다. Figure 12.9에서는 "중지 단어 관리" 창을 보여 줍니다. "구 관리" 및 "어간 예외 관리" 창은 "중지 단어 관리" 창과 동일합니다. "재코딩 관리" 창은 약간 다릅니다. 자세한 내용은 재코딩 관리에서 확인하십시오.
그림 12.9 중지 단어 관리 창
"중지 단어 관리" 창에는 지정된 중지 단어의 다양한 범위(또는 위치)를 나타내는 중지 단어 목록이 여러 개 포함되어 있습니다. 각 목록 아래에는 텍스트 편집 상자와 추가 버튼이 있습니다. 이러한 컨트롤을 사용하여 각 범위에 사용자 중지 단어를 추가할 수 있습니다. 중지 단어를 드래그하여 한 범위에서 다른 범위로 이동할 수 있습니다. 한 목록에서 다른 목록으로 항목을 복사하여 붙여 넣을 수도 있습니다. 창 아래에 있는 두 개의 버튼을 클릭하면 선택된 항목이 한 범위에서 왼쪽 또는 오른쪽의 다음 범위로 이동합니다. X 버튼을 클릭하면 선택된 항목이 현재 범위에서 제거됩니다. 또한 항목을 두 번 클릭하고 텍스트를 변경하여 목록의 기존 항목을 편집할 수 있습니다.
언어
기본 제공 중지 단어 목록과 사용자 라이브러리의 선택 항목을 저장할 언어를 지정합니다. "언어"에서 "항목 적용"을 선택하면 변경 사항이 주 사용자 라이브러리에 저장됩니다. 언어 설정은 기본 제공 범위와 사용자 및 프로젝트 범위에만 적용됩니다.
기본 제공(잠김)
지정된 언어의 중지 단어에 대한 기본 제공 목록입니다. 기본 제공 중지 단어를 "지역 예외" 목록에 포함하면 중지 단어 목록에서 제외할 수 있습니다.
사용자
지정된 언어의 사용자 라이브러리에 있는 중지 단어를 나열합니다.
프로젝트
(텍스트 탐색기가 프로젝트 내에서 시작된 경우에만 사용할 수 있습니다.) 지정된 언어의 현재 프로젝트에 있는 중지 단어를 나열합니다.
열
텍스트 열의 "중지 단어" 열 특성에 지정된 중지 단어를 나열합니다.
지역
지역 범위의 중지 단어를 나열합니다. JSL을 통해 텍스트 탐색기를 시작할 때 이러한 단어를 지정할 수 있습니다. 이러한 중지 단어는 현재 텍스트 탐색기 플랫폼 보고서에서만 사용됩니다.
지역 예외
현재 텍스트 탐색기 플랫폼에서 중지 단어로 처리되지 않는 단어를 나열합니다. JSL을 통해 텍스트 탐색기를 시작할 때 이러한 단어를 지정할 수 있습니다. "지역 예외"에 나열된 단어는 다른 모든 범위에 나열된 단어를 재정의합니다.
가져오기
텍스트 파일에서 중지 단어를 가져올 수 있습니다. 중지 단어는 클립보드에 복사됩니다. 이를 기본 제공 목록 이외의 목록에 붙여 넣을 수 있습니다.
내보내기
중지 단어를 클립보드 또는 텍스트 파일로 내보낼 수 있습니다. 중지 단어를 내보낼 범위와 내보낼 위치를 선택할 수 있는 "내보내기" 창이 나타납니다.
사용자 라이브러리 파일은 TextExplorer 디렉터리에 있습니다. 이 디렉터리의 위치는 다음과 같이 컴퓨터 운영 체제에 따라 다릅니다.
• Windows: C:\Users\<username>\AppData\Roaming\JMP\JMP\TextExplorer\<lang>\
• macOS: /Users/<username>/Library/Application Support/JMP/TextExplorer/<lang>/
주 사용자 라이브러리 파일은 TextExplorer 디렉터리 자체에 있습니다. 이러한 파일은 언어별로 다르지 않습니다.
확인을 클릭하면 "사용자", "프로젝트" 및 "열" 목록의 변경 사항이 각각 사용자 라이브러리, 프로젝트 및 열 특성에 저장됩니다. "지역" 및 "지역 예외" 목록에 지정된 모든 항목은 텍스트 탐색기 보고서 스크립트를 저장할 때만 저장됩니다.
중지 단어를 사용자 라이브러리에 저장할 경우 파일 이름은 stopwords.txt로 지정됩니다. 열 특성에 저장할 경우에는 해당 특성을 "중지 단어"라고 합니다.
"재코딩 관리" 창은 "중지 단어 관리" 창과는 약간 다릅니다. 각 목록 아래에는 텍스트 편집 상자가 하나가 아니라 두 개 있습니다. 이전 값(위쪽 상자에서 지정)은 새 값(아래쪽 상자에서 지정)으로 재코딩됩니다.
사용자 라이브러리에 재코딩을 저장하는 경우 파일 이름은 recodes.txt로 지정됩니다. 열 특성에 저장할 경우에는 해당 특성을 "재코딩"이라고 합니다.
사용자 라이브러리에 구를 저장하는 경우 파일 이름은 phrases.txt로 지정됩니다. 열 특성에 저장할 경우에는 해당 특성을 "구"라고 합니다.
사용자 라이브러리에 어간 예외를 저장하는 경우 파일 이름은 stemExceptions.txt로 지정됩니다. 열 특성에 저장할 경우에는 해당 특성을 "어간 예외"라고 합니다.
참고: "어간 예외 관리" 창의 "로컬 예외" 목록에는 어간 예외 목록에서 제외되는 어간 예외가 나열됩니다. 이 목록에 있는 단어는 어간 추출 작업에 관련되지 않습니다.
부정 용어 관리"부정 용어 관리" 창은 감정 분석 보고서에서 사용할 수 있습니다. 자세한 내용은 감정 분석에서 확인하십시오.
사용자 라이브러리에 부정 용어를 저장하는 경우 파일 이름은 negations.txt로 지정됩니다. 열 특성에 저장할 경우에는 해당 특성을 "부정 용어"라고 합니다.
참고: "지역" 또는 "지역 예외" 목록에 나타나는 용어는 현재 감정 분석 보고서에만 적용됩니다.
강조사 용어 관리"강조사 용어 관리" 창은 감정 분석 보고서에서 사용할 수 있습니다. 이 창은 "중지 단어 관리" 창과 약간 다릅니다. 각 목록 아래에 텍스트 편집 상자가 있을 뿐만 아니라 승수 컨트롤도 있습니다. 승수 컨트롤을 사용하면 강조사 용어 집합에 추가할 때 용어의 강조 승수를 지정할 수 있습니다. 자세한 내용은 감정 분석에서 확인하십시오.
사용자 라이브러리에 강조사 용어를 저장하는 경우 파일 이름은 intensifiers.txt로 지정됩니다. 열 특성에 저장할 경우에는 해당 특성을 "강조사 용어"라고 합니다.
참고: "지역" 또는 "지역 예외" 목록에 나타나는 용어는 현재 감정 분석 보고서에만 적용됩니다.
감정 용어 관리"감정 용어 관리" 창은 감정 분석 보고서에서 사용할 수 있습니다. 이 창은 "중지 단어 관리" 창과 약간 다릅니다. 각 목록 아래에 텍스트 편집 상자가 있을 뿐만 아니라 "스코어" 컨트롤도 있습니다. 스코어 컨트롤을 사용하면 감정 용어 집합에 추가할 때 용어의 감정 스코어를 지정할 수 있습니다. 자세한 내용은 감정 분석에서 확인하십시오.
사용자 라이브러리에 감정 용어를 저장하는 경우 파일 이름은 sentiments.txt로 지정됩니다. 열 특성에 저장할 경우에는 해당 특성을 "감정 용어"라고 합니다.
참고: "지역" 또는 "지역 예외" 목록에 나타나는 용어는 현재 감정 분석 보고서에만 적용됩니다.