발행일 : 03/10/2025

Image shown here데이터 처리 옵션

함수 데이터 탐색기 플랫폼의 "데이터 처리" 빨간색 삼각형 메뉴에는 다음 옵션이 포함되어 있습니다.

정리

다음과 같은 데이터 정리 옵션이 포함된 하위 메뉴입니다.

0 제거

값이 0인 관측값을 제거합니다. 데이터에 0이 없으면 0 값이 없음을 나타내는 경고가 표시됩니다.

값 제거

데이터에서 제거할 값을 지정할 수 있는 규격 창을 표시합니다.

선택한 항목 제거

데이터 테이블에서 선택한 행에 해당하는 관측값을 제거합니다.

선택 취소한 항목 제거

데이터 테이블에서 선택하지 않은 행에 해당하는 관측값을 제거합니다.

주의: "선택한 항목 제거" 및 "선택 취소한 항목 제거"는 행 번호를 제거합니다. "자동 재계산"이 활성화된 경우 이러한 옵션을 사용하기 전에 행을 추가하거나 삭제해야 합니다.

X 필터링

지정된 구간을 벗어나는 X 값을 제거합니다. "X 필터링" 옵션을 선택하면 "다음 값 미만" 및 "다음 값 초과" 값을 지정해야 합니다. 지정된 구간을 벗어나는 X 값은 분석에 사용되지 않습니다.

Y 필터링

지정된 구간을 벗어나는 Y 값을 제거합니다. "Y 필터링" 옵션을 선택하면 "다음 값 미만" 및 "다음 값 초과" 값을 지정해야 합니다. 지정된 구간을 벗어나는 Y 값은 분석에 사용되지 않습니다.

축소

다음 기법 중 하나를 사용하여 X 값에 대한 데이터를 줄입니다.

"격자" 탭을 사용하여 관측값을 값의 공통 격자에 보간합니다. 격자 크기를 지정할 수 있습니다. 기본적으로 격자 크기는 가장 긴 함수의 값 개수입니다. 이는 최대 허용 격자 크기이기도 합니다.

"계급" 탭을 사용하여 고유 X 값에서 균등한 간격으로 지정된 수의 계급을 생성합니다. 각 함수(또는 "ID, 함수" 변수의 수준)에 대해 계급 내의 관측값을 평균화하여 해당 계급 수준에 대한 Y 값을 생성합니다.

"줄임" 탭을 사용하여 X 값에 대한 모든 N개 관측값을 제거합니다. 여기서 N은 지정된 줄임 비율에 의해 결정됩니다. 이 작업은 각 함수(또는 "ID, 함수" 변수의 수준)에 대해 수행됩니다. 줄임 비율의 기본값은 2이며, 이 값은 각 함수에서 관측값의 절반을 제거합니다.

참고: "제거" 옵션을 사용하면 지정된 관측값이 분석 및 모델링 보고서에서 제외되지만 데이터 테이블에서 해당 관측값이 변경되지는 않습니다.

변환

다음과 같은 데이터 변환 옵션이 포함된 하위 메뉴입니다.

중심화

결과를 가운데에 맞춥니다.

표준화

평균 0, 분산 1이 되도록 데이터를 중심에 맞추고 척도를 조정하여 결과를 표준화합니다.

범위 0 ~ 1

0 ~ 1 범위에 들어가도록 결과의 척도를 조정합니다.

제곱근

결과의 제곱근을 계산하여 데이터를 변환합니다. 출력 값은 음수가 아니어야 합니다.

제곱

결과의 제곱을 계산하여 데이터를 변환합니다.

로그

결과의 자연 로그를 계산하여 데이터를 변환합니다.

지수

결과의 지수 함수를 계산하여 데이터를 변환합니다.

부정

결과에 음수를 취해 데이터를 변환합니다.

로짓

결과의 로짓 함수를 계산하여 데이터를 변환합니다. 출력 값은 0에서 1 사이여야 합니다.

로그 X

입력의 자연 로그를 계산하여 데이터를 변환합니다.

맞춤

다음과 같은 입력 데이터 맞춤 옵션이 포함된 하위 메뉴입니다.

행 맞춤

입력 값을 행 번호로 바꿉니다.

최대 맞춤

각 ID 수준에 대해 관측된 최대 출력 값을 사용하여 함수를 정렬합니다. 관측된 최대 출력 값과 관련된 입력 값은 각 ID 수준에 대해 0으로 설정되고, 다른 입력 값은 관측된 최대값과 0 사이의 차이에 따라 위 또는 아래로 이동합니다.

최소 맞춤

각 ID 수준에 대해 관측된 최소 출력 값을 사용하여 함수를 정렬합니다. 관측된 최소 출력 값과 관련된 입력 값은 각 ID 수준에 대해 0으로 설정되고, 다른 입력 값은 관측된 최소값과 0 사이의 차이에 따라 위 또는 아래로 이동합니다.

0 ~ 1 정렬

입력 값의 범위가 0 ~ 1이 되도록 출력 함수를 정렬합니다.

팁: "0 ~ 1 정렬"은 P-스플라인 모형을 적합시킬 때 특히 유용합니다.

함수별 정렬

각 함수가 입력 값의 전체 최소값에서 시작하여 입력 값의 전체 최대값에서 끝나도록 출력 함수를 정렬합니다.

DTW(동적 시간 뒤틀림)

(함수가 두 개 이상인 경우에만 사용 가능) DTW(동적 시간 뒤틀림)를 사용하여 출력 함수를 정렬합니다. DTW는 둘 이상의 함수를 서로 맞추기 위해 최적의 뒤틀림을 찾는 함수 맞춤 기법입니다. DTW 옵션을 선택하면 "대조 함수 선택" 창이 나타납니다. 이를 사용하여 대조 함수를 선택합니다. 대조 함수는 나머지 함수를 맞출 때 사용할 기준 함수입니다.

대조 함수를 선택하고 "확인"을 클릭하면 나머지 쿼리 함수 목록과 함께 뒤틀림 함수 그림이 표시됩니다. 뒤틀림 함수 그림에서 대조 함수는 y 축에 있고 선택한 쿼리 함수는 x 축에 있습니다. 빨간색 대각선(y = x)과의 편차는 맞춤을 개선하기 위해 쿼리 함수의 입력에 뒤틀림이 적용되었음을 나타냅니다.

스펙트럼

스펙트럼 데이터에 유용한 다음 옵션이 포함된 하위 메뉴입니다.

SNV

표준 정규 변량 방법을 데이터에 적용합니다. 이 방법은 평균 0, 표준편차 1이 되도록 각 개별 함수(ID 변수의 수준)를 중심에 맞추고 척도를 조정하여 출력을 표준화합니다.

MSC

승법 산포 수정을 데이터에 적용합니다. 각 개별 함수(ID 변수의 수준)에 대해 단순 선형 회귀가 적합됩니다. 여기서 반응은 함수의 출력 값이고 회귀변수는 평균 함수의 출력 값입니다. 원래 출력 값 yit는 다음 방정식을 사용하여 새 값 y*it로 대체됩니다.

Equation shown here

여기서 b0ib1i는 함수 i에 대한 단순 선형 회귀에서 얻은 절편과 기울기입니다. 자세한 내용은 Geladi et al 연구 자료(1985)에서 확인하십시오.

Savitzky-Golay

Savitzky-Golay 방법을 사용할 수 있는 옵션을 제공합니다. 자세한 내용은 Savitzky and Golay 연구 자료(1964)에서 확인하십시오.

참고:Savitzky-Golay 방법과 관련된 모든 옵션을 사용하려면 입력 데이터가 균등한 간격의 격자에 있어야 하고 적어도 하나의 함수에 7개 이상의 데이터 점이 포함되어야 합니다. 데이터가 균등한 간격의 격자에 있지 않은 경우 Savitzky-Golay 옵션을 선택하면 균등한 간격의 격자에 데이터가 자동으로 배치됩니다.

필터

Savitzky-Golay 필터를 데이터에 적용합니다. 이 방법은 로컬 다항식을 도메인 전체의 여러 점 집합에 적합시킵니다. 최소 제곱을 사용하여 다항식이 적합되고 각 적합의 점 수는 대역폭에 의해 결정됩니다. 이 옵션을 선택하면 0, 1, 2차 다항식과 최대 10개의 대역폭에 대해 여러 적합이 생성됩니다. 각 함수의 최량 적합 모형은 AIC를 기준으로 선택됩니다. 다항식 차수와 대역폭은 함수마다 다를 수 있습니다.

1차 도함수

2차 또는 3차 다항식만 사용하여 Savitzky-Golay 필터를 데이터에 적용한 후 1차 도함수를 사용합니다. 필터가 다항식을 적합시키므로 도함수가 분석적으로 계산됩니다.

2차 도함수

3차 다항식만 사용하여 Savitzky-Golay 필터를 데이터에 적용한 후 2차 도함수를 사용합니다. 필터가 다항식을 적합시키므로 도함수가 분석적으로 계산됩니다.

기준 수정

각 개별 함수에서 기준 함수를 뺍니다. 기준 수정은 제거할 추세 또는 기준을 알고 있을 때 사용됩니다. 예를 들어 데이터 측정 방식의 아티팩트가 원인일 수 있습니다. 일반적으로 정보는 데이터의 정상점에 있으므로 이러한 영역은 기준 모형에 포함되지 않습니다.

이 옵션을 선택하면 기준 수정 창이 표시됩니다. 이 창에는 데이터를 표시하는 선택 그림과 기준 모형을 지정하는 옵션 집합이 포함되어 있습니다. 기준 수정 창에는 다음 옵션이 있습니다.

기준 모형

기준 함수에 대한 모형 유형을 지정합니다. 선형, 2차, 3차, 2모수 지수 또는 3모수 지수 모형을 지정할 수 있습니다.

수정 영역

기준 함수를 빼는 영역을 지정합니다. 전체 함수 영역에서 기준을 빼거나, 기준 모형을 생성하는 데 사용된 영역에서만 기준을 뺄 수 있습니다.

기준 영역

선택 그림에 파란색 세로선 한 쌍을 추가하거나 제거합니다. 선은 처음에 서로 포개져 있습니다. 이 선을 이동하여 기준 모형에 포함하지 않을 데이터 영역을 지정할 수 있습니다. 파란색 선 쌍 사이에 있는 데이터 영역은 기준 모형에 포함되지 않습니다.

앵커 지점

선택 그림에 빨간색 세로선을 추가하거나 제거합니다. 이 선은 기준 모형에 적용되는 데이터 점을 지정합니다.

대상 함수

(함수가 두 개 이상인 경우에만 사용 가능) 대상 함수를 로드할 수 있습니다.

대상 로드

대상 함수를 지정할 수 있는 창을 표시합니다. 대상 함수는 모든 함수가 대상 함수(대조 함수 또는 황금 곡선이라고도 함)처럼 보이도록 곡선 매칭에 사용됩니다.

대상 함수를 지정하는 경우 해당 함수의 데이터는 모형 적합에 사용되지 않습니다. 대상 함수를 지정하면 FPC 프로파일러에 다른 옵션이 추가됩니다. 자세한 내용은 FPC 프로파일러에서 확인하십시오.

참고:다른 전처리 단계를 수행하기 전에 대상 함수를 로드해야 합니다.

DTW(동적 시간 뒤틀림) 옵션

뒤틀림 함수 그림

뒤틀림 함수 그림을 표시하거나 숨깁니다. 기본적으로 설정되어 있습니다.

거리 행렬 저장

거리 행렬을 별도의 데이터 테이블에 저장합니다. 거리 행렬은 함수를 군집화하는 데 유용할 수 있습니다. 거리 행렬 데이터 테이블에는 "계층적 군집화" 스크립트가 포함되어 있습니다.

뒤틀림 함수 저장

뒤틀림 함수를 별도의 데이터 테이블에 저장합니다. 데이터 테이블의 각 행에는 DTW 조정 입력 변수, 원래 입력 변수 및 ID 변수가 포함됩니다.

더 많은 정보를 원하십니까? 질문이 있습니까? JMP 사용자 커뮤니티에서 답변 받기 (community.jmp.com).