유전학 > 표지자 시뮬레이션 > 표지자 시뮬레이션 플랫폼 시작

발행일 : 03/10/2025

표지자 시뮬레이션 플랫폼 시작

실험 데이터에서 유전자 교배를 시뮬레이션하려면 분석 > 유전학 > 표지자 시뮬레이션을 선택하여 표지자 시뮬레이션 플랫폼을 시작합니다.

그림 4.3 표지자 시뮬레이션 시작 창

Marker Simulation Launch Window

표지자

원하는 표지자 열을 선택하고 표지자를 클릭하여 분석할 표지자를 지정합니다.

예측 변수 계산식

예측 변수 계산식이 포함된 열을 지정하려면 이 옵션을 사용합니다. 이러한 계산식은 사건이 측정 또는 추론된 과거 데이터를 기반으로 개발되었습니다. 예를 들면 모형 적합, 반응 변수 선별, XGBoost 등 JMP의 예측 플랫폼에서 하나 이상의 예측 모델링 프로세스를 사용하여 생성됩니다. 그런 다음 속성은 알려져 있지만 사건이 아직 발생하지 않은 새 데이터에 예측 모형이 적용됩니다. 자세한 내용은 "Generating Predictor Formulas for Marker Simulation"에서 확인하십시오.

참고: 해당하는 예측 변수 계산식 열이 없는 형질 열은 시뮬레이션 중에 무시됩니다.

교배

교배에서 부모를 구별하는 데 사용할 열을 지정하려면 이 옵션을 사용합니다. 예를 들어 "Sex"를 지정하면 플랫폼에서 성별이 다른 부모(남녀)만 교배하도록 지시합니다.

표본 ID

각 행에 대한 고유 식별자를 하나씩 또는 조합하여 제공할 수 있는 값을 가진 하나 이상의 변수를 지정하려면 이 옵션을 사용합니다.

기준

기준 변수의 각 수준에 대해 개별 보고서를 생성합니다. 기준 변수가 둘 이상 할당되면 기준 변수의 가능한 각 수준 조합에 대해 개별 보고서가 생성됩니다.

배수성

연구 중인 실험 생물체의 배수성 수준을 지정할 수 있습니다. 이 값은 짝수여야 합니다.

교배 당 개체 수

반복 실험 수를 지정할 수 있습니다.

세대 수

세대 수를 지정합니다.

주석 테이블 사용

별도의 데이터 테이블에 포함된 주석 정보에 액세스할 수 있습니다. 확인을 클릭하면 주석 테이블의 이름과 위치를 지정하라는 창이 나타납니다.

예측 변수 계산식에 있는 표지자만 사용

예측 변수 계산식을 개발하는 데 사용된 표지자만 시뮬레이션하도록 제한하려면 이 상자를 선택합니다. 예측 변수 계산식을 생성하는 데 사용되는 알고리즘은 보통 일부 변수 선택 방법을 사용하여 데이터 집합에서 가장 유의한 표지자의 부분집합을 선택합니다. 형질 예측 변수가 나열된 열을 마우스 오른쪽 버튼으로 클릭하고 열 정보를 선택하면 사용된 표지자를 볼 수 있습니다.

다양성 추정

각 교배의 자손에 대한 다형성, 이형접합성, 대립유전자 다양성 및 빈도의 추정값을 계산하려면 이 상자를 선택합니다.

결측 표지자 대치법

표지자 데이터가 결측이면 이 방법이 실행되지 않습니다. 이 때문에 모든 결측 데이터가 대치되어야 합니다. 이 옵션을 사용하여 결측값 대치 방법을 지정할 수 있습니다.

– 각 유전자형 클래스의 빈도가 데이터에서 관측된 빈도로 설정되는 다항 분포에서 무작위 추출을 통해 결측 유전자형을 대치하려면 HWE 해제를 선택합니다.

– 각 유전자형 클래스의 빈도가 Hardy-Weinberg 평형을 가정했을 때의 기대 빈도로 설정되는 다항 분포에서 무작위 추출을 통해 결측 유전자형을 대치하려면 HWE 설정을 선택합니다.

– 허용되는 값(0, 1, 2, ..., K) 중 하나를 무작위로 할당하려면 랜덤을 선택합니다. 이때 K는 배수성 수준입니다.

– 0과 배수성 값 사이의 지정된 정수로 결측 유전자형을 대치하려면 지정됨을 선택합니다.

결측값 대치 값

결측 유전자형 대신 사용할 값을 지정하려면 이 옵션을 사용합니다.

열성, 우성 또는 이형접합으로 대치하려면 먼저 지정됨을 선택한 후 "결측값 대치 값" 상자에 0과 배수성 사이의 값을 입력할 수 있습니다. 이배체 생물의 경우 열성 동형접합은 0, 이형접합은 1, 우성 동형접합은 2를 각각 입력합니다. 둘 다 이배체를 가정합니다.

참고: 이 옵션은 결측 표지자 대치법을 지정됨으로 선택한 경우에만 사용할 수 있습니다.

최선 개체 선택

후속 교배에 사용하기 위해 각 세대에서 지정된 형질 기준을 충족하는 자손만 선택하려면 이 상자를 선택합니다. 선택에 사용되는 각 형질에 대한 선택 기준을 지정해야 합니다. 하한, 상한 또는 특정 목표값을 지정할 수 있습니다.

특정 한계보다 크거나 같은 형질 값을 가진 자손을 다음 세대로 이동하도록 선택하려면 하한을 지정합니다. 특정 한계보다 작거나 같은 형질 값을 가진 자손을 다음 세대로 이동하도록 선택하려면 상한을 지정합니다. 특정 목표값과 동일한 형질 값을 가진 자손을 다음 세대로 이동하도록 선택하려면 목표값을 지정합니다.

참고: 목표값은 형질이 비연속형일 때 지정됩니다.

특정 형질에 대해 상한과 하한을 모두 지정하여 상한과 하한으로 구성된 구간 내에 속하는 형질 값을 가진 자손만 선택할 수 있습니다. 상한 또는 하한과 함께 목표값을 지정하는 것은 유효하지 않습니다.

마지막 선택 기준은 형질에 대해 지정된 모든 기준의 교집합입니다. 예를 들어 규격 한계가 L1<= Trait1, L2 <= Trait2 <= U2, Trait3 == T3인 경우 선택 기준은 L1<= Trait1, L2 <= Trait2 <= U2 및 Trait3 == T3을 모두 충족해야 합니다. 이 기준에 맞는 자손이 다음 세대로 선택됩니다.

자손 선택 기준을 지정하는 방법에 대한 자세한 내용은 "Specifying Trait Selection Criteria for Marker Simulation"에서 확인하십시오.

참고: 하나 이상의 예측 변수 계산식 열에 규격 한계가 지정되지 않은 경우 이 옵션은 무시됩니다.

선택한 개체 수

이 옵션을 사용하면 각 세대에서 후속 교배 시 부모로 사용할 형질 선택 기준을 충족하는 자손의 상한을 지정할 수 있습니다. 이 제한은 이후 각 세대에서 반복적으로 적용됩니다.

선택한 교배 수

이 옵션을 사용하면 형질 선택 기준을 충족하는 교배 수의 상한을 지정할 수 있습니다. 이전 교배의 자손이 선택 기준에 따라 평가되고 필요한 경우 이 제한이 후속 교배에 적용됩니다. 이 제한은 이후 각 세대에서 반복적으로 적용됩니다.

선 그림 생성을 위한 임계

다세대 교배를 나타내는 선 그림을 생성하려면 상당한 컴퓨터 리소스가 필요하며, 너무 많이 생성하려고 하면 컴퓨터 리소스에 과부하가 올 수 있습니다. 이 옵션을 사용하여 선 그림 생성에 사용되는 교배 수의 상한을 설정할 수 있습니다. 교배 수가 지정된 값을 초과하면 JMP에서 이러한 그림을 생성하지 않습니다.

난수 시드값 설정

난수 스트림을 시작할 음수가 아닌 정수를 지정하려면 이 옵션을 사용합니다. 값에 따라 알고리즘 결과가 달라집니다.

언스레드

멀티스레딩을 제한합니다. 계산 속도를 높이려면 이 옵션을 선택 취소합니다.

표지자 시뮬레이션 플랫폼에 필요한 데이터 형식

대부분의 JMP 프로세스는 입력 테이블에 특정 데이터 구조가 있다고 가정합니다. JMP는 세로형 데이터 집합과 가로형 데이터 집합을 구분합니다. 세로형 데이터 테이블은 열에 표본이 있고 행에 분자 본체(예: 표지자, 유전자, 클론, 단백질 또는 대사물질)가 있는 반면, 가로형 데이터 테이블은 세로형 데이터 테이블을 전치하여 행에 표본이 있고 열에 분자 본체가 있습니다.

프로세스를 위한 입력 데이터 집합을 지정할 때 필요한 형식을 알고 있어야 합니다. 표지자 시뮬레이션에는 가로형 데이터 테이블이 필요합니다. "테이블" 메뉴의 "전치" 옵션을 사용하면 데이터 테이블을 세로형과 가로형 간에 변환할 수 있습니다.

표지자 데이터는 한 열에 숫자 형식으로 인코딩되어야 합니다. 일반적으로 이 형식을 사용하면 가장 흔하지 않은 대립유전자(마이너 대립유전자)에 대한 동형접합 이배체 개체는 테이블에서 2로 표시되고, 이형접합체는 1로 표시됩니다. 가장 흔한 대립유전자에 대한 동형접합체는 0으로 표시됩니다.

더 많은 정보를 원하십니까? 질문이 있습니까? JMP 사용자 커뮤니티에서 답변 받기 (community.jmp.com).