발행일 : 03/10/2025

열의 데이터 재코딩

"재코딩" 도구를 사용하여 열의 모든 값을 한 번에 변경할 수 있습니다. 예를 들어 컴퓨터 회사와 제약 회사의 매출을 비교하는 데 관심이 있다고 가정해 보겠습니다. 현재 회사 라벨은 Computer와 Pharmaceutical입니다. 이를 "Technical" 및 "Drug"로 변경하려고 합니다. 32개 행의 모든 데이터를 검토하고 모든 값을 변경하는 것은 지루하고 비효율적이며 오류가 발생하기 쉽습니다. 더 많은 데이터 행이 있을 때 특히 그렇습니다. 재코딩이 더 좋은 방법입니다.

참고:

여러 열에 있는 유사한 값을 재코딩하려면 열 > 속성 표준화의 "재코딩" 옵션을 사용하십시오. 자세한 내용은 열 속성 표준화에서 확인하십시오.

열 머리글만 재코딩하려면 열 > 열 이름 > 열 이름 재코딩을 선택하십시오.

데이터를 재코딩하려면 다음 단계를 수행하십시오.

1. 도움말 > 샘플 데이터 폴더를 선택하고 Companies.jmp를 엽니다.

2. Type 열의 머리글을 한 번 클릭하여 해당 열을 선택합니다.

3. 열 > 재코딩을 선택합니다.

기본적으로 "새 열"이 선택되어 있으므로 재코딩된 값이 새 열에 포함됩니다. 새 열의 이름이 Type 2로 지정됩니다.

4. "재코딩" 창의 새 값 상자에 원하는 값을 입력합니다. 이 예에서는 "Computer" 행에 "Technical"을 입력하고, "Pharmaceutical" 행에 "Drug"를 입력합니다.

"변경 사항" 상자에 재코딩된 값이 표시됩니다.

그림 4.44 재코딩 창 

Recode Window

5. 재코딩을 클릭합니다.

데이터 테이블의 Type 2라는 새 열에 새 값이 표시됩니다.

참고:

기본적으로 재코딩된 데이터는 새 열에 표시됩니다. 선택한 열을 항상 그 자리에서 재코딩하려면 파일 > 환경 설정(Windows) 또는 JMP > 환경 설정(macOS)을 선택하고, 재코딩을 선택한 다음, "커밋 스타일" 목록에서 현재 위치를 선택하십시오.

기본적으로 "재코딩" 창의 데이터는 새 값을 기준으로 오름차순으로 정렬됩니다. 이것은 "재코딩" 및 "열 이름 재코딩" 모두에 적용됩니다. 데이터가 정렬되는 방식을 변경하려면 파일 > 환경 설정(Windows) 또는 JMP > 환경 설정(macOS)을 선택하고 재코딩을 선택한 다음 "정렬 스타일" 환경 설정을 변경하십시오. 데이터 테이블에 나타나는 일반 순서에 따라 열 이름을 정렬하고 지정된 경우 값 순서 열 특성의 순서에 따라 데이터를 정렬하려면 이전 값을 선택하십시오. 개수별로 내림차순으로 정렬하려면 개수를 선택하십시오.

데이터 테이블에 값 라벨이 포함되어 있으면 "재코딩" 창에서 "새 라벨"이라는 열에 라벨이 표시됩니다. 이 라벨을 편집하면 "값 라벨" 열 특성도 수정됩니다. 값을 값 라벨로 바꾸기를 선택하여 "새 값" 열의 데이터를 수정할 수도 있습니다.

열을 재코딩하면 값 라벨, 값 스코어, 값 순서, 값 색상, 상위 범주, 코딩 및 결측값 코드 열 특성이 업데이트됩니다.

숫자 데이터 유형인 열에 숫자가 아닌 값을 입력하면 데이터 유형을 문자로 변환하라는 메시지가 표시됩니다. 열을 변환하고 새 값을 표시하려면 를 클릭하십시오. 열을 숫자로 유지하고 결측값을 표시하려면 아니요를 클릭하십시오.

"재코딩" 창에서 행을 선택하면 빠른 편집을 위해 데이터 테이블에서도 해당 행이 선택됩니다.

재코딩 도구는 표현식 열을 지원합니다.

재코딩 옵션

"재코딩"의 빨간색 삼각형 옆에 있는 목록에서는 다음 옵션을 사용할 수 있습니다.

새 열

변경된 데이터를 포함할 새 열을 생성하고 원래 열을 유지합니다.

계산식 열

변경 사항을 값 대신 계산식으로 포함하는 새 열을 생성합니다. 데이터 테이블에서 원래 열의 값을 변경하면 계산식 열에서 해당 값이 자동으로 업데이트됩니다.

현재 위치

모든 변경 사항을 원래 데이터 열에 적용합니다.

"재코딩" 창에서 사용할 수 있는 그 외의 옵션은 다음과 같습니다.

필터

특정 값을 검색합니다. 검색 옵션을 선택하려면 아래쪽 화살표를 클릭합니다. 각 옵션에 대한 자세한 내용은 재코딩의 검색 필터 옵션에서 확인하십시오. 정규 표현식을 입력하여 필터를 사용자 정의할 수도 있습니다.

그룹 보기

그룹 해제된 값을 보려면 선택 취소합니다. 기본적으로 선택되어 있습니다.

그룹화된 항목만 표시

그룹화된 상태의 재코딩된 값을 표시합니다.

그룹 해제된 항목만 표시

그룹화되지 않은 값을 표시합니다.

그룹

여러 값이 선택되어 있을 때 활성화됩니다. 강조 표시된 값을 동일한 그룹에 포함하려면 그룹을 클릭합니다. 그룹화하기 전에 이미 값을 편집한 경우에는 편집된 값이 "새 값" 열의 그룹 대표가 됩니다. 그렇지 않은 경우에는 가장 자주 발생하는 값이 그룹 대표가 됩니다.

모두

모든 데이터 값을 표시합니다.

수정된 항목만

수정된 재코딩 값만 표시합니다.

수정되지 않은 항목만

수정되지 않은 재코딩 값만 표시합니다.

변경 사항

"재코딩" 창에서 적용한 변경 사항의 목록을 표시합니다.

Image shown here

창에서 마지막으로 변경한 사항을 되돌립니다.

Image shown here

창에서 마지막으로 변경한 사항을 재호출합니다.

스크립트

재코딩된 데이터 테이블을 다시 생성하기 위한 스크립트를 저장하려면 빨간색 삼각형 메뉴에서 "스크립트"를 선택한 후 옵션을 선택합니다.

"재코딩" 창에는 다음과 같은 스크립트 옵션이 포함되어 있습니다.

작업 시퀀스 스크립팅

데이터를 제외하고 작업만 스크립트로 저장합니다. 빨간색 삼각형 옵션을 사용하여 모든 문자열을 대문자로 변환할 경우, 생성된 스크립트에는 데이터를 포함하지 않고 입력 문자열을 대문자로 변환하는 코드가 포함됩니다.

시퀀스 압축

불필요한 작업을 제거하여 순차적으로 실행된 작업의 스크립트를 압축합니다. 여러 건의 편집이 포함된 재코딩을 빠르게 완료하려면 이 옵션을 사용하는 것이 좋습니다.

다중 반응

빈 항목 제거

데이터 테이블의 다중 반응 열을 재코딩할 때 열의 빈 항목을 제외합니다.

중복 항목 제거

다중 반응 열에서 중복 항목을 제외합니다. 예를 들어 원래 데이터가 a, b, b, c이고 이러한 특정 항목을 변경하지 않았다면 데이터 테이블의 재코딩된 열에는 a, b, c가 포함됩니다.

항목 정렬

다중 반응 열에서 항목을 사전순으로 정렬합니다. 예를 들어 원래 데이터가 b, a, c이고 이러한 특정 항목을 변경하지 않았다면 데이터 테이블의 재코딩된 열에는 a, b, c가 포함됩니다.

재코딩을 위한 빨간색 삼각형 옵션

"재코딩" 창의 빨간색 삼각형 메뉴에는 옵션이 포함되어 있습니다.

첫 글자 대문자 형식으로 변환

각 단어의 첫 번째 문자를 대문자로 변환하고 나머지 문자는 소문자로 변환합니다.

대문자로 변환

모든 값을 대문자로 변환합니다.

소문자로 변환

모든 값을 소문자로 변환합니다.

공백 자르기

선행 및 후행 공백 문자를 제거합니다. 예를 들어 John이라는 이름을 앞뒤에 공백이 있는 채로 가져온 경우 이 명령으로 공백을 삭제할 수 있습니다.

공백 제거

후행, 선행 및 중간 공백 문자를 제거합니다.

Collapse Whitespace

선행 및 후행 공백 문자를 제거하고 중간에 있는 중복 공백 문자도 제거합니다. 즉, 공백 문자가 둘 이상 있는 경우 공백 접기 명령을 사용하면 두 개의 공백이 한 개의 공백으로 바뀝니다.

구두점 제거

단어의 처음, 중간 및 끝에서 인용 부호 및 앰퍼샌드 같은 특수 문자를 제거합니다.

문자열 바꾸기

지정한 문자를 모두 새 문자열 또는 아무것도 없는 상태로 바꿉니다. 정규 표현식을 입력하여 바꾸기를 사용자 정의할 수도 있습니다.

첫 번째 단어

문자열의 첫 번째 단어를 기준으로 값을 그룹화합니다. 예를 들어 "John Smith"와 "John Adams"라는 값이 있는 경우 이 명령을 사용하면 두 값이 "John" 아래에 그룹화됩니다.

마지막 단어

문자열의 마지막 단어를 기준으로 값을 그룹화합니다.

유사한 값 그룹화

데이터 그룹화 방식을 사용자 정의할 수 있습니다. 그룹화 옵션 목록에서 원하는 방식을 선택합니다. 자세한 내용은 재코딩을 위한 유사한 값 그룹화 옵션에서 확인하십시오.

고급

첫 번째 단어를 제외한 모든 단어

첫 번째 단어를 제외한 후 나머지 값을 기준으로 값을 분할합니다.

마지막 단어를 제외한 모든 단어

마지막 단어를 제외한 후 나머지 값을 기준으로 값을 분할합니다.

테이블의 매핑 적용

매핑 데이터 테이블의 열을 사용하여 목표 테이블의 값을 수정할 수 있습니다. 자세한 내용은 매핑 열에 있는 값 적용의 예에서 확인하십시오.

세그먼트 추출

특정 문자열을 추출할 수 있습니다. 자세한 내용은 쉼표를 기준으로 분할의 예에서 확인하십시오.

최근접 선택

매핑 데이터 테이블의 열에 있는 값을 재코딩하려는 열에 매핑할 수 있습니다.

숫자로 파싱

데이터를 숫자로 변환합니다.

라벨을 코드로

라벨이 지정된 값을 코드로 변환합니다.

문자로 변환

숫자 열을 문자 열로 변환합니다.

값 라벨 추가

각 값에 값 라벨을 할당할 수 있습니다.

값을 값 라벨로 바꾸기

"값 라벨" 열 특성에 지정된 값을 사용자가 지정하는 값 라벨로 바꿉니다. 이 옵션은 열에 "값 라벨" 특성이 있는 경우에만 사용할 수 있습니다.

재호출

"재코딩" 창에서 이전에 수행한 변경 작업을 재호출합니다.

다시 시작

창을 기본 상태로 되돌립니다.

스크립트

재코딩 스크립트를 가져오거나 병합하거나 저장하기 위한 옵션을 표시합니다.

파일에서 가져오기: JSL 스크립트를 가져와서 이전에 재코딩한 데이터를 재코딩합니다. 다른 데이터에 대해 동일한 스크립트를 실행하여 동일한 방식으로 데이터를 재코딩할 수 있습니다.

데이터 테이블에서 가져오기: 데이터 테이블에 저장된 JSL 스크립트를 가져옵니다.

재코딩 결과 열에서 가져오기: 선택한 열(일반적으로 이전에 재코딩 결과를 저장한 열)에서 데이터를 가져옵니다.

파일에 저장: 재코딩 변경 사항을 JSL 스크립트에 저장합니다. "저장"을 선택하면 파일의 이름을 지정한 후 저장하라는 메시지가 표시됩니다.

데이터 테이블에 저장: 재코딩 스크립트를 현재 데이터 테이블에 저장합니다.

저장된 스크립트에서 재코딩을 수정하려면 데이터 테이블의 스크립트를 마우스 오른쪽 버튼으로 클릭하고 재코딩을 사용하여 편집을 선택합니다. 변경 후에는 빨간색 삼각형 메뉴에서 스크립트 > 데이터 테이블에 저장을 다시 선택하여 변경 사항을 새 스크립트에 저장합니다.

데이터 테이블 스크립트와 병합: "재코딩" 창에서 변경한 사항을 데이터 테이블에 저장된 현재 재코딩 스크립트에 병합합니다. 스크립트가 여러 개이면 재코딩한 데이터를 병합하는 데 사용할 스크립트를 선택하라는 메시지가 표시됩니다.

스크립트 창에 저장: 재코딩 스크립트를 스크립트 창에 추가합니다.

Image shown here계산식 저장소에 게시

다른 스크립트에서 코드를 재사용할 수 있도록 재코딩 스크립트를 계산식 저장소에 게시합니다.

재코딩을 위한 마우스 오른쪽 버튼 클릭 옵션

다음과 같은 처음 6개의 옵션은 그룹화된 값에 사용할 수 있습니다.

새 값으로 그룹화

(여러 값을 선택한 경우에만 사용 가능) 두 개 이상의 선택된 값에 대한 새 값을 지정할 수 있습니다.

~(으)로 그룹화

(여러 값을 선택한 경우에만 사용 가능) 선택한 값을 마우스 오른쪽 버튼으로 클릭하여 다른 그룹화 값 또는 그룹 대표를 선택할 수 있습니다. 이 목록에는 처음 8개의 가능한 그룹 대표가 표시됩니다.

새 값 교환

두 개의 값이 강조 표시된 경우 첫 번째 값의 새 값에 두 번째 값의 새 값을 적용하거나 그 반대로 적용하려면새 값 교환을 선택합니다.

대표 생성

그룹의 단일 값을 마우스 오른쪽 버튼으로 클릭하고 대표 생성을 선택하면 선택한 값이 새 값이 됩니다.

그룹에서 제거

값이 그룹화된 후 하나 이상의 값을 마우스 오른쪽 버튼으로 클릭하여 해당 그룹에서 제거할 수 있습니다.

유사한 값 그룹화

단일 문자열을 마우스 오른쪽 버튼으로 클릭하여 유사한 값을 찾을 수 있습니다. 이 경우 "그룹화 옵션" 창이 나타납니다. 자세한 내용은 재코딩을 위한 유사한 값 그룹화 옵션에서 확인하십시오.

모든 그룹 열기

각 그룹의 모든 값을 볼 수 있도록 그룹을 엽니다.

모든 그룹 닫기

각 그룹 내의 값을 축소합니다.

다음 옵션은 모든 데이터에 사용할 수 있습니다.

행 선택하기

데이터 테이블에서 선택된 행을 선택합니다. "재코딩" 창에서 행을 선택하면 데이터 테이블에서 해당 행이 자동으로 선택됩니다. 그러나 데이터 테이블에서 행을 선택하면 "재코딩"에서 행이 선택되지 않습니다. "재코딩" 창에 표시된 행만 선택하려면 행을 마우스 오른쪽 버튼으로 클릭하고 이 옵션을 선택하십시오.

데이터 테이블로 만들기

"재코딩" 창에 표시된 결과를 포함하는 데이터 테이블을 생성합니다.

선택한 열 내 행 복사

마우스 오른쪽 버튼으로 클릭한 열의 데이터만 복사합니다. 그런 다음 해당 데이터를 데이터 테이블에 붙여 넣을 수 있습니다.

선택한 테이블 내 행 복사

모든 열의 데이터를 복사합니다. 그런 다음 해당 데이터를 데이터 테이블에 붙여 넣을 수 있습니다.

재코딩을 위한 유사한 값 그룹화 옵션

다음과 같은 유사한 값 그룹화 명령을 선택하여 그룹화 정확도를 높일 수 있습니다.

대/소문자 무시

항목의 대/소문자를 무시합니다.

인쇄할 수 없는 문자 무시

인쇄할 수 없는 문자를 무시합니다. 일부 데이터에는 컴퓨터만 인식할 수 있는 파일 구분자 등의 인쇄할 수 없는 문자가 포함되어 있을 수 있습니다.

공백 무시

공백을 무시합니다.

구두점 무시

구두점을 무시합니다.

문자 편집 허용

유사한 값을 그룹화할 때 문자를 새 값으로 바꿀 수 있도록 합니다.

최대 차이 비율

최대 비율 차이에 따라 값을 그룹화합니다. 예를 들어 최대 25%의 차이가 있는 값을 그룹화하려면 "0.25"를 입력합니다.

최대 문자 차이

인접하지 않은 문자 차이의 최대 개수에 따라 값을 그룹화합니다. 예를 들어 5자 이하의 차이가 있는 값을 그룹화하려면 "5"를 입력합니다.

최소 소스 문자열 길이

너무 짧은 문자열은 매칭되지 않도록 합니다. 이 옵션과 "최대 차이 비율" 및 "최대 문자 차이" 옵션을 다양하게 사용해 보고 데이터에 적합한 값을 지정하십시오.

재코딩의 검색 필터 옵션

검색 상자 옆의 아래쪽 화살표 버튼을 클릭하여 검색을 구체화할 수 있습니다.

용어 포함

검색 기준의 일부가 포함된 항목을 반환합니다. "ease oom"을 검색하면 "Release Zoom"과 같은 메시지가 반환됩니다.

구 포함

검색 기준이 정확히 포함된 항목을 반환합니다. "text box"를 검색하면 "text"와 "box"가 바로 연이어 포함된 항목(예: "Context Box" 및 "Text Box")이 반환됩니다.

구로 시작

검색 기준으로 시작하는 항목을 반환합니다.

구로 끝남

검색 기준으로 끝나는 항목을 반환합니다.

전체 구

전체 문자열로 구성된 항목을 반환됩니다. "text box"를 검색하면 "text box"만 포함된 항목이 반환됩니다.

정규 표현식

검색 상자에서 와일드카드(*)와 마침표(.)를 사용할 수 있습니다. "get.*name"을 검색하면 "get" 다음에 하나 이상의 단어가 포함된 항목을 찾을 수 있습니다. 즉, "Get Color Theme Names", "Get Name Info" 및 "Get Effect Names" 등이 반환됩니다.

결과 반전

검색 기준과 매칭되지 않는 항목을 반환합니다.

모든 용어 일치

문자열이 모두 포함된 항목을 반환합니다. "t test"를 검색하면 검색 문자열 중 하나 또는 둘 모두가 포함된 요소(예: "Pat Test", "Shortest Edit Script" 및 "Paired t test")가 반환됩니다.

대/소문자 무시

검색 기준의 대/소문자를 무시합니다.

전체 단어 일치

"모든 용어 일치" 설정에 따라 문자열의 각 단어가 포함된 항목을 반환합니다. "모든 용어 일치" 옵션이 선택되어 있는 경우 "data filter"를 검색하면 "data"와 "filter"가 반환됩니다.

유사한 값으로 그룹화의 예

서로 다른 문자의 개수에 따라 유사한 값을 그룹화할 수 있습니다.

1. 도움말 > 샘플 데이터 폴더를 선택하고 Candy Bars.jmp를 엽니다.

2. 이름 열을 선택합니다.

3. 열 > 재코딩을 선택합니다.

4. 빨간색 삼각형을 클릭하고 유사한 값 그룹화를 선택합니다.

5. "문자 편집 허용"이 선택되어 있는지 확인합니다.

6. "최대 차이 비율" 옆에 "5"를 입력합니다.

그러면 JMP가 50% 이하의 차이가 있는 값을 그룹화할 수 있습니다. 즉, 동일한 문자를 50% 또는 절반 이상 공유하는 값을 그룹화할 수 있습니다. 차이 비율은 각 값의 최대 문자 수와 지정된 두 값 간의 최대 고유 문자 수를 비교하여 결정됩니다.

7. "최대 문자 차이" 옆에 "6"을 입력합니다.

6자 이하의 값이 그룹화됩니다.

8. 확인을 클릭합니다.

그림 4.45 유사한 값 그룹화 

Grouping Similar Values

새 값 열에 표시된 값은 재코딩 대상 데이터 테이블에서 그룹화되는 값을 나타냅니다.

9. (선택 사항) 그룹의 다른 이전 값을 나타내도록 새 값을 변경하려면 "Almond Roca"를 마우스 오른쪽 버튼으로 클릭하고 대표 생성을 선택합니다.

그림 4.46 대표 생성 

Make Representative

10. (선택 사항) 데이터 테이블의 원래 데이터를 재코딩된 데이터로 바꾸려면 빨간색 삼각형 메뉴에서 현재 위치를 선택한 다음 재코딩을 클릭합니다.

쉼표를 기준으로 분할의 예

Aircraft Incidents.jmp 샘플 데이터 테이블에는 도시와 주 이름이 쉼표로 구분된 열이 포함되어 있습니다. 이 열의 값을 쉼표를 기준으로 분할하고 주 이름만 포함하도록 열을 재코딩할 수 있습니다.

1. 도움말 > 샘플 데이터 폴더를 선택하고 Aircraft Incidents.jmp를 엽니다.

2. Location 열을 선택하고 열 > 재코딩을 선택합니다.

그림 4.47 원래 데이터 

Original Data

3. 빨간색 삼각형을 클릭하고 고급 > 세그먼트 추출을 선택합니다.

미리보기 페인의 데이터에는 도시 이름 다음에 약어 형식의 주 이름이 포함되어 있습니다. 각 문자열의 마지막 2자를 추출하려고 합니다.

4. 창 상단의 공백 포함구두점 포함을 선택 취소합니다.

공백과 구두점이 추출 대상에서 제외됩니다.

5. "문자" 상자에 쉼표를 입력합니다.

그림 4.48 구분자 지정 

Specifying a Delimiter

마지막 2자를 추출하는 데 쉼표가 사용됩니다.

6. "세그먼트 추출" 창에서 "시작 앵커"와 "끝 앵커" 위에 "2"를 입력합니다.

세그먼트 추출이 시작되고 두 번째 단어만이 남습니다.

7. "시작 앵커"와 "끝 앵커"에 "처음부터"가 선택되어 있어야 합니다.

그림 4.49 세그먼트 추출 창 

Extract Segment Window

팁: "캡처할 텍스트" 섹션에서 왼쪽 또는 오른쪽 화살표를 클릭하여 값을 스크롤하면 설정을 미리 볼 수 있습니다.

8. Figure 4.49에 표시된 미리보기 페인에서는 대체 값에 주 이름 약어만 포함되어 있습니다.

9. 미리보기 페인에서 아래로 스크롤합니다. "Atlantic Ocean"의 경우 현재 값과 대체 값이 동일합니다. 이 데이터는 쉼표를 기준으로 분할할 수 없습니다.

그림 4.50 주 이름이 없는 데이터 

Data with No State

10. 확인을 클릭합니다.

매칭되는 주 이름이 있는 항목이 그룹화됩니다.

그림 4.51 재코딩된 도시, 주 이름 

Recoded City, State Name

매핑 열에 있는 값 적용의 예

매핑 데이터 테이블의 열에는 다른 데이터 테이블의 열을 재코딩하는 데 사용할 수 있는 값이 포함되어 있습니다. 이 예에서는 State Capitals.jmp에 포함된 미국 주 이름을 State Abbreviations.jmp
(매핑 데이터 테이블)에 정의된 주 약어로 바꿉니다.

1. 도움말 > 샘플 데이터 폴더를 선택하고 State Abbreviations.jmpState Capitals.jmp를 엽니다.

2. State Capitals.jmp에서 U.S. States 열을 선택합니다.

3. 열 > 재코딩을 선택합니다.

4. 빨간색 삼각형을 클릭하고 고급 > 테이블의 매핑 적용을 선택합니다.

5. 테이블 선택을 클릭하고 State Abbreviations.jmp를 선택한 다음 확인을 클릭합니다.

6. "매칭 열" 상자에서 U.S. States를 선택합니다.

7. "대체 값 열" 상자에서 Abbreviations를 선택합니다.

매칭 열과 대체 값 열에 매핑 결과가 표시됩니다.

그림 4.52 열 매칭 및 바꾸기 

Matching and Replacing Columns

8. 비매칭 항목을 다음으로 바꾸기 상자를 선택하고 "no match"를 입력합니다.

미리보기 섹션에 값 매핑 방식이 표시됩니다. 아래로 스크롤하면 "no match"로 표시된 주는 철자가 올바르지 않아서 Abbreviations 열의 어떤 주에도 매핑되지 않았음을 알 수 있습니다.

그림 4.53 매칭되지 않는 열의 미리보기 

Preview of Unmatched Columns

9. 확인을 클릭하고 재코딩을 클릭합니다.

약어 형식 주 이름이 포함된 새 열이 State Capitals.jmpU.S. States 2라는 이름으로 표시됩니다.

그림 4.54 약어 형식 주 이름 

Abbreviated State Names

매칭되지 않은 항목을 수정하는 방법은 철자가 올바르지 않은 단어 수정의 예에서 확인하십시오.

철자가 올바르지 않은 단어 수정의 예

데이터 테이블을 사전으로 사용하여 철자가 올바르지 않은 단어를 수정할 수 있습니다. State Abbreviations.jmp에는 미국의 주 이름 및 약어가 포함된 열이 있습니다. State Capitals.jmp에는 실제 데이터와 비슷하지만 철자가 올바르지 않은 주 이름이 몇 개 포함되어 있습니다. 이 예에서는 철자가 올바르지 않은 주 이름을 수정하는 방법을 보여 줍니다.

1. 도움말 > 샘플 데이터 폴더를 선택하고 State Abbreviations.jmpState Capitals.jmp를 엽니다.

2. State Capitals.jmp에서 U.S. States 열을 선택합니다.

3. 열 > 재코딩을 선택합니다.

4. 빨간색 삼각형을 클릭하고 고급 > 최근접 선택을 선택합니다.

5. 테이블 선택을 클릭하고 State Abbreviations를 선택한 다음 확인을 클릭합니다.

6. "매칭 열" 상자에서 U.S. States를 선택합니다.

7. 미리보기 페인에서 아래로 스크롤하면 "Massachusets"가 "Massachusetts"로 바뀌고, "Missisippi"는 "Mississippi"로 바뀔 것임을 알 수 있습니다.

그림 4.55 철자가 올바르지 않은 주 이름 대체 

Misspelled State Replacement

8. 확인을 클릭하고 재코딩을 클릭합니다.

업데이트된 주 이름이 포함된 새 열이 데이터 테이블에 추가됩니다.

예: 숫자로 파싱

"숫자로 파싱" 옵션은 문자 데이터를 숫자 데이터로 변환합니다. 이 옵션은 JSL Num() 문자 함수와 유사합니다.

날짜 및 시간, 통화, 과학적 표기법과 같은 많은 형식이 지원됩니다. 지원되지 않는 형식의 경우에는 결측값이 표시됩니다.

1. 데이터 테이블을 열고 숫자 값과 문자 값이 모두 포함된 열을 선택합니다.

그림 4.56 숫자 데이터와 문자 데이터가 포함된 열 

Column of Numeric and Character Data

2. 열 > 재코딩을 선택합니다.

3. 빨간색 삼각형 메뉴에서 숫자로 파싱을 선택합니다.

이전 값과 새 값이 표시됩니다.

그림 4.57 새 값 미리보기 

Preview of New Values

4. 재코딩을 클릭합니다.

재코딩된 값이 포함된 새 열이 데이터 테이블에 추가됩니다. 열의 데이터 유형은 숫자입니다.

"a"는 숫자로 파싱할 수 없으므로 새 열에서 해당 값에는 결측값이 표시됩니다.

그림 4.58 파싱된 숫자 

Parsed Numbers

예: 재코딩된 값을 다른 열에 적용

열을 재코딩할 때 재코딩된 값을 스크립트에 저장할 수 있습니다. 이 스크립트를 가져오거나 실행하면 원래 재코딩한 열이 다시 재코딩됩니다.

예를 들어 다른 열을 동일한 값으로 재코딩하려고 한다고 가정해 보겠습니다. 재코딩된 값을 계산식 열에 저장한 후 계산식을 편집할 수 있습니다.

1. "재코딩" 창의 "새 값" 열에 재코딩된 값을 입력합니다.

2. 빨간색 삼각형 메뉴 옆의 목록에서 계산식 열을 선택합니다.

3. 재코딩을 클릭합니다.

4. 계산식 열을 마우스 오른쪽 버튼으로 클릭하고 계산식을 선택합니다.

5. 계산식에서 재코딩된 열을 선택합니다.

이 예에서는 sex 열이 재코딩되었습니다.

그림 4.59 재코딩된 열 

Recoded Column

6. 열 목록에서 sex를 바꿀 열을 선택합니다.

이 예에서는 sex 열을 gender로 바꿀 것이므로 gender를 선택합니다.

그림 4.60 gender 열 선택 

Selecting the gender Column

더 많은 정보를 원하십니까? 질문이 있습니까? JMP 사용자 커뮤니티에서 답변 받기 (community.jmp.com).