JMP에서는 데이터 테이블의 열을 압축하여 파일 크기를 최소화하고 데이터를 분석하는 데 필요한 메모리 양을 줄일 수 있습니다. 이 기능은 숫자 열에 작은 정수가 많이 포함되어 있거나 열에 포함된 고유 값의 수가 255개 미만일 때 유용합니다. 예를 들어 389개의 열과 85,000개의 행이 있는 데이터 테이블의 열을 압축하면 데이터 유형에 따라 파일 크기를 250MB에서 33MB까지 줄일 수 있습니다.
열을 압축할 때 JMP는 데이터 유형에 따라 데이터를 보다 압축된 형식으로 저장할 수 있는지 여부를 확인합니다.
• 고유 값이 255개 미만인 문자 열의 경우, 해당되면 열에 "목록 확인" 특성이 추가됩니다(Figure 4.37). 환경 설정에 "16비트 목록 확인 압축 허용"이 선택되어 있으면 255개 이상의 고유 값이 있는 문자 열에 "목록 확인" 특성도 추가됩니다.
"목록 확인" 특성은 선택된 열의 값을 유효한 값으로 제한합니다. 선택된 열의 값 수가 너무 많으면 "목록 확인" 특성이 적용되지 않습니다. 예를 들어 값 수와 행 수가 거의 동일하면 데이터 테이블에서 해당 행에 "목록 확인" 특성이 추가되지 않습니다.
• 숫자 열의 경우, "최적", "고정 소수점" 또는 "데이터" 형식의 열만 압축됩니다. 데이터는 가능한 경우 1바이트, 2바이트 또는 4바이트 정수로 압축됩니다(Figure 4.38). 짧은 정수에 대한 자세한 내용은 짧은 정수 형식에서 확인하십시오.
정수가 아닌 값이 포함된 숫자 열도 고유 값의 수가 255개 미만이면 압축할 수 있습니다. 이 경우 해당 열에 "목록 확인" 특성이 추가됩니다.
참고:
• 고유 값의 수가 65,535개보다 작거나 같은 열을 자동으로 압축하려면 "일반" 그룹에서 16비트 목록 확인 압축 허용 환경 설정을 선택하십시오. 열에 "목록 확인" 특성도 추가됩니다.
• "목록 확인" 특성이 있는 열에서는 목록에 있는 값만 입력할 수 있습니다. 그렇지 않으면 새 값을 입력하려고 할 때 셀에 올바르지 않은 데이터가 포함되어 있다는 경고가 표시됩니다. 자세한 내용은 목록 확인에서 확인하십시오.
그림 4.37 압축된 문자 열에 추가된 목록 확인 특성
그림 4.38 압축 전후의 숫자 열을 보여 주는 열 정보 창
열을 압축하려면 하나 이상의 열을 선택하고 열 > 유틸리티 > 선택 열 압축을 선택합니다. 압축할 수 있는 열이 무엇인지 모르는 경우에는 모든 열을 선택합니다.
가능한 경우 해당 열이 압축됩니다. 로그에는 압축된 열 및 압축 방식이 표시됩니다. 로그를 보려면 보기 > 로그를 선택합니다.
참고: 숫자 열을 수동으로 압축하려면 "테이블" 환경 설정에서 짧은 숫자 데이터를 허용하도록 설정한 후 해당 열의 데이터 유형을 1바이트 정수, 2바이트 정수 또는 4바이트 정수로 변경하십시오. 이 환경 설정에 대한 자세한 내용은 데이터 테이블 환경 설정에서 확인하십시오.