기본 분석 > 일원 분석 > 일원 분석 플랫폼의 추가 예 > 일원 분석을 위한 데이터 쌓기의 예
발행일 : 03/10/2025

일원 분석을 위한 데이터 쌓기의 예

데이터가 JMP 데이터 테이블이 아닌 다른 형식으로 존재하는 경우 데이터 배열이 한 행에 여러 관측값에 대한 정보가 포함되는 방식일 수도 있습니다. JMP에서 데이터를 분석하려면 데이터를 가져온 후 JMP 데이터 테이블의 각 행에 단일 관측값에 대한 정보가 포함되도록 데이터를 재구성해야 합니다. 예를 들어 데이터가 스프레드시트에 들어 있다고 가정해 보겠습니다. 세 개의 생산 라인에서 생산된 제품에 대한 데이터가 세 개의 열 집합에 배열되어 있습니다. JMP 데이터 테이블에서는 세 개 생산라인에서 얻은 데이터를 단일 열 집합에 쌓아 각 행이 단일 제품의 데이터를 나타내도록 해야 합니다.

설명 및 목표

이 예에서는 서로 다른 세 개의 생산 라인에서 무작위로 표집된 시리얼 상자의 중량이 포함된 Fill Weights.xlsx 파일을 사용합니다. Figure 6.35에서는 이 데이터의 형식을 보여 줍니다.

"ID" 열에는 측정된 각 시리얼 상자의 식별자가 포함되어 있습니다.

"Line" 열에는 해당 생산 라인에서 표집된 상자의 중량(온스)이 포함되어 있습니다.

그림 6.35 데이터 형식 

Data Format

상자의 목표 충진 중량은 12.5온스입니다. 세 개의 생산 라인이 목표를 충족하고 있는지 여부에 관심이 있지만 우선은 세 라인이 동일한 평균 충진 중량을 달성하고 있는지 확인하려고 합니다. 일원 분석을 사용하여 평균 충진 중량 간에 차이가 있는지 검정할 수 있습니다.

일원 분석 플랫폼을 사용하려면 다음을 수행해야 합니다.

1. 데이터를 JMP로 가져옵니다. 자세한 내용은 데이터 가져오기에서 확인하십시오.

2. 데이터를 재구성하여 JMP 데이터 테이블에서 각 행이 단일 관측값만 반영하도록 합니다. 데이터를 재구성하려면 시리얼 상자 ID, 라인 식별자 및 중량을 해당 열에 쌓아야 합니다. 자세한 내용은 데이터 쌓기에서 확인하십시오.

데이터 가져오기

이 예에서는 Microsoft Excel의 데이터를 JMP로 가져오는 두 가지 방법을 보여 줍니다. 한 가지 방법을 선택하거나 두 방법을 모두 사용해 보십시오.

파일 > 열기 옵션을 사용하여 Excel 가져오기 마법사로 Microsoft Excel 파일의 데이터를 가져옵니다. 자세한 내용은 Excel 가져오기 마법사를 사용하여 데이터 가져오기에서 확인하십시오. 이 방법은 모든 Excel 파일에 편리한 방법입니다.

Microsoft Excel의 데이터를 복사하여 새 JMP 데이터 테이블에 붙여 넣습니다. 자세한 내용은 Excel에서 데이터 복사 및 붙여넣기에서 확인하십시오. 데이터 파일이 작은 경우에 이 방법을 사용할 수 있습니다.

Microsoft Excel에서 데이터를 가져오는 방법에 대한 자세한 내용은 JMP 사용Microsoft Excel 파일 가져오기에서 확인하십시오.

Excel 가져오기 마법사를 사용하여 데이터 가져오기

1. 도움말 > 샘플 데이터 폴더를 선택하고 Samples/Import Data 폴더에 있는 Fill Weights.xlsx를 엽니다.

파일이 Excel 가져오기 마법사에서 열립니다.

2. 열 머리글이 시작되는 행 옆에 3을 입력합니다.

Excel 파일의 1행에는 테이블에 대한 정보가 포함되어 있고 2행은 비어 있습니다. 열 머리글 정보가 3행에서 시작됩니다.

3. 열 머리글이 포함된 행 수에 2를 입력합니다.

Excel 파일의 3행과 4행에 모두 열 머리글 정보가 포함됩니다.

4. 가져오기를 클릭합니다.

그림 6.36 Excel 가져오기 마법사를 사용하여 생성된 JMP 테이블 

JMP Table Created Using Excel Import Wizard

7개의 행에 데이터가 있고 각 행마다 여러 개의 ID가 나타납니다. 세 개 라인 각각에 대해 ID 및 중량 열이 있으며 총 열 수는 6개입니다.

ID 열 이름의 "Weights" 부분은 불필요한 데다 혼동을 일으킬 수 있습니다. 지금 열 이름을 바꿀 수도 있지만 데이터를 쌓은 후 열 이름을 바꾸는 것이 더 효율적입니다.

5. 데이터 쌓기로 진행합니다.

Excel에서 데이터 복사 및 붙여넣기

1. Microsoft Excel에서 Fill Weights.xlsx를 엽니다.

2. 테이블 내의 데이터를 선택하되 불필요한 "Weights" 머리글은 제외합니다.

3. 마우스 오른쪽 버튼을 클릭하고 복사를 선택합니다.

4. JMP에서 파일 > 새로 만들기 > 데이터 테이블을 선택합니다.

5. 편집 > 열 이름과 함께 붙여넣기를 선택합니다.

"열 이름과 함께 붙여넣기" 옵션은 클립보드의 선택 내용에 열 이름이 포함된 경우에 사용됩니다.

그림 6.37 "열 이름과 함께 붙여넣기"를 사용하여 생성된 JMP 테이블 

JMP Table Created Using Paste with Column Names

6. 데이터 쌓기로 진행합니다.

데이터 쌓기

"쌓기" 옵션을 사용하여 새 데이터 테이블의 각 행에 하나의 관측값이 포함되도록 할 수 있습니다. "쌓기" 옵션에 대한 자세한 내용은 JMP 사용데이터 테이블에서 열 쌓기에서 확인하십시오.

1. JMP 데이터 테이블에서 테이블 > 쌓기를 선택합니다.

2. 6개의 열을 모두 선택하고 열 쌓기를 클릭합니다.

3. 다중 계열 쌓기를 선택합니다.

두 개의 계열, 즉 ID와 라인을 쌓을 것이므로 "계열 수"는 변경하지 않고 기본값 2로 설정된 상태로 둡니다. 계열이 포함된 열은 인접해 있지 않고 한 열씩 번갈아 표시되어 있습니다("ID", "Line A", "ID", "Line B", "ID", "Line C"). 따라서 "인접"은 선택하지 않습니다.

4. 행별로 쌓기를 선택 취소합니다.

5. 결측 행 제거를 선택합니다.

6. 출력 테이블 이름 옆에 Stacked를 입력합니다.

7. 확인을 클릭합니다.

새 데이터 테이블에서 데이터데이터 2는 ID 및 중량 데이터가 포함된 열입니다.

8. 라벨 열 머리글을 마우스 오른쪽 버튼으로 클릭하고 열 삭제를 선택합니다.

라벨 열 내의 항목은 가져온 데이터 테이블에 있는 상자 ID 열의 머리글입니다. 이러한 항목은 필요하지 않습니다.

9. 각 열의 열 머리글을 두 번 클릭하여 이름을 바꿉니다.

데이터 -> ID

라벨 2 -> Line

데이터 2 -> Weight

10. "열" 패널에서 ID 왼쪽의 아이콘을 클릭하고 명목형을 선택합니다.

ID는 숫자로 지정되기는 했지만 식별자이므로 모델링 유형을 명목형으로 처리해야 합니다. 이 예에서는 이 단계가 중요하지 않지만 항상 열에 적절한 모델링 유형을 할당하는 것이 좋습니다.

11. (파일 > 열기를 사용하여 Excel에서 데이터를 가져온 경우에만 해당) 다음을 수행합니다.

1. Line 열 머리글을 클릭하여 해당 열을 선택하고 열 > 재코딩을 선택합니다.

2. 새 열을 클릭하고 현재 위치를 선택합니다.

3. 새 값 열의 값을 아래의 Figure 6.38에 표시된 것과 매칭되도록 변경합니다.

그림 6.38 열 값 재코딩 

Recode Column Values

4. 재코딩을 클릭합니다.

이제 JMP 분석에 적절하게 새 데이터 테이블이 구성되었습니다. 각 행에는 단일 시리얼 상자에 대한 데이터가 포함되어 있습니다. 첫 번째 열에는 상자 ID가 있고, 두 번째 열에는 생산 라인이 있으며, 세 번째 열에는 상자의 중량이 있습니다(Figure 6.39).

그림 6.39 재코딩된 데이터 테이블 

Recoded Data Table

일원 분석 수행

이 부분에는 다음과 같은 작업이 포함되어 있습니다.

일원 분산 분석을 수행하여 세 개의 생산 라인 간에 평균 충진 중량의 차이가 있는지 검정합니다.

비교 원을 생성하여 차이가 있을 수 있는 라인을 확인합니다.

가중치를 조정하거나 상자를 보다 상세히 검토하려는 경우 ID로 점에 라벨을 지정합니다.

시작하기 전에 Stacked 데이터 테이블을 사용하고 있는지 확인하십시오.

1. 분석 > X로 Y 적합을 선택합니다.

2. Weight를 선택하고 Y, 반응을 클릭합니다.

3. Line을 선택하고 X, 요인을 클릭합니다.

4. 확인을 클릭합니다.

5. "일원 분석"의 빨간색 삼각형 메뉴를 클릭하고 평균/ANOVA를 선택합니다.

그림의 평균 다이아몬드는 생산 라인 평균에 대한 95% 신뢰 구간을 보여 줍니다. 평균 다이아몬드 외부의 점은 이상치인 것처럼 보일 수도 있습니다. 하지만 그렇지 않습니다. 이를 확인하기 위해 그림에 상자 그림을 추가합니다.

6. "일원 분석"의 빨간색 삼각형 메뉴를 클릭하고 표시 옵션 > 상자 그림을 선택합니다.

모든 점이 상자 그림 경계 내에 있습니다. 따라서 모두 이상치가 아닙니다.

7. 데이터 테이블의 "열" 패널에서 ID를 마우스 오른쪽 버튼으로 클릭하고 라벨/라벨 해제를 선택합니다.

8. 그림에서 점을 마우스로 가리키면 해당 점의 ID 값과 함께 LineWeight 데이터가 표시됩니다(Figure 6.40).

9. "일원 분석"의 빨간색 삼각형 메뉴를 클릭하고 평균 비교 > 전체 쌍 비교(Tukey HSD)를 선택합니다.

그림 오른쪽의 패널에 비교 원이 표시됩니다.

10. 맨 아래 비교 원을 클릭합니다.

그림 6.40 Weight 대 Line의 일원 분석 

Oneway Analysis of Weight by Line

"분산 분석" 보고서에서 p 값이 0.0102인 것은 평균이 모두 동일하지 않다는 증거입니다. 이 그림에는 라인 C에 대한 비교 원이 선택되어서 빨간색으로 표시되어 있습니다. 라인 B에 대한 원은 굵은 회색으로 표시되므로 라인 C의 평균은 유의 수준 0.05에서 라인 B의 평균과 차이가 있습니다. 라인 A 및 B의 평균은 통계적으로 유의한 차이를 나타내지 않습니다.

그림에 표시된 평균 다이아몬드는 평균에 대한 95% 신뢰 구간 범위에 있습니다. 95% 신뢰 구간의 수치 한계는 "일원 ANOVA에 대한 평균" 보고서에서 제공됩니다. 이 두 가지는 모두 라인 B 및 C에 대한 신뢰 구간에 목표 충진 중량인 12.5가 포함되지 않았음을 나타냅니다. 라인 B는 중량 초과로 보이고 라인 C는 중량 미달로 보입니다. 이 두 생산 라인의 경우 목표 충진 중량 미충족을 초래한 근본적인 원인을 해결해야 합니다.

더 많은 정보를 원하십니까? 질문이 있습니까? JMP 사용자 커뮤니티에서 답변 받기 (community.jmp.com).