遗传学 > 标记模拟 > 启动“标记模拟”平台

发布日期: 03/04/2025

启动“标记模拟”平台

根据您的实验数据模拟基因杂交，通过选择分析 > 遗传学 >标记模拟启动“标记模拟”平台。

图 4.3 “标记模拟”启动窗口

此处显示图片

标记

选择所需的标记列，然后点击标记指定要分析的标记。

预测变量公式

使用该选项指定包含预测变量公式的列。这些公式基于测量或推断的事件的历史数据开发。它们使用 JMP 中的预测平台（例如“拟合模型”、“响应筛选”、“XGBoost”等），使用一个或多个预测建模过程生成。预测模型随后会应用于已知特性的新数据，但事件尚未发生。请参见Generating Predictor Formulas for Marker Simulation获取详细信息。

注意：模拟过程中会忽略缺少相应的“预测变量公式”列的任何性状列。

杂交

使用该选项指定用于区分杂交的亲本的列。例如，指定“性别”可指引平台仅对具有不同性别（雄性与雌性）的亲本进行杂交。

样本 ID

使用该选项指定一个或多个变量，这些变量的值可以单独或组合在一起，提供每行的唯一标识符。

依据

为“依据”变量的每个水平生成单独报表。若指定了多个“依据”变量，将为“依据”变量水平的每种可能组合生成单独的报表。

倍性

允许您指定所研究的实验生物体的倍性水平。注意：该值必须是偶数

每次杂交的个体数

允许您指定复制的次数。

遗传世代数

指定世代的数量。

使用注解表

允许您访问在单独的数据表中包含的注解信息。您点击确定之后，会出现一个窗口，提示您指定注解表的名称和位置。

使用仅在预测变量公式中找到的标记

选中该框可将模拟限制为仅用预测变量公式中的那些标记。用于生成预测变量公式的算法通常使用一些变量筛选的方法来选择数据集中最显著标记的子集。您可以通过右击列出性状预测变量的列并选择列信息来查看标记。

估计多样性

选中该框可计算每个杂交后代的多态、杂合度和等位基因多样性和频率的估计值。

缺失标记插补方法

当您的数据缺少标记数据时，该方法不会运行。因此，必须对任何缺失数据进行插补。使用该选项可指定如何插补缺失值。

‒ 选择 HWE 关闭可使用多项式分布中的随机抽取来插补缺失基因型，其中每个基因型类的频数都设置为数据中的观测频数。

‒ 选择 HWE 打开可使用多项式分布中的随机抽取来插补缺失基因型，其中每个基因型类的频数都设置为 Hardy-Weinberg 平衡假设下的期望频数。

‒ 选择随机随机指定一个可接受值（0, 1, 2, ..., K（其中 K 是倍性水平））。

‒ 选择指定可使用介于 0 和倍性数之间的指定整数插补缺失基因型。

插补值

使用该选项可指定一个值来代替任何缺失的基因型。

要使用隐性、显性或杂合值进行插补，请首先选择指定，然后在“插补值”框中输入从 0 到倍性的数字。对于二倍体生物体，输入 0 表示“隐性纯合”，1 表示“杂合”，2 表示“显性纯合”（均假定为二倍体）。

注意：仅当将指定选作“缺失标记插补方法”时该选项才可用。

选择最佳个体

选中该框可在每一世代中仅选择满足指定性状条件的后代，用于后续杂交。您必须为用于选择的每个性状指定选择条件。您可以指定下限、上限或特定的目标值。

指定下限可选择性状值大于等于该限值的后代以移至下一代。指定上限可选择性状值小于等于该限值的后代以移至下一代。指定目标值可选择性状值等于该目标的后代以移至下一代。

注意：当性状不连续时，会进行目标值指定。

您可以为任何给定的性状同时指定上限和下限，以仅选择性状值落在上限和下限构成的区间内的后代。与上限或下限一起指定的目标值无效。

最终的选择条件是为性状指定的所有条件的交集。例如，若“规格限”为 L1<= 性状1，L2 <= 性状2 <= U2 且性状3 == T3，则构造的选择条件为 L1<= 性状1 且 L2 <= 性状2 <= U2 且性状3 == T3。任何满足该条件的后代将选择为下一代。

请参见Specifying Trait Selection Criteria for Marker Simulation获取有关如何指定条件以选择后代的详细信息。

注意：该选项会被忽略，除非已为至少一个“预测变量公式”列指定了“规格限”。

所选个体的数目

该选项使您可以在每一世代中指定满足性状选择条件的后代的上限，以用作后续杂交中的亲本。该限值会在后续的每个世代中重复应用。

选定的杂交数

该选项使您可以指定满足性状选择条件的杂交数的上限。会根据选择条件评估前一次杂交中的后代，然后将该限值（若需要）应用于后续杂交。该限值会在后续的每个世代中重复应用。

生成线图的阈值

生成表示多代杂交的线图需要大量的计算机资源；尝试生成过多会导致消耗过多计算机的资源。使用该选项可设置用于生成线图的杂交数的上限。若杂交数超过指定值，JMP 不会尝试生成这些图。

设置随机种子

使用该选项可指定一个非负整数以启动随机数流。不同的值会生成不同的算法结果。

非线程

禁止多线程。取消选择该选项可提高计算速度。

“标记模拟”平台所需的数据格式

JMP 中的大多数过程认定输入表具有特定的数据结构。JMP 区分高型和宽型数据集。高型数据表以样本作为列，分子实体（例如，标记、基因、克隆、蛋白质或代谢物）作为行，而宽型数据表是高型数据表的转置，以样本作为行，分子实体作为列。

为过程指定输入数据集时，了解所需的格式十分重要。“标记模拟”需要宽型数据表。“表”菜单下的“转置”平台使您可以在高型和宽型格式之间转换您的数据。

标记数据必须采用单列数值格式编码。通常，在这种格式中，最不常见或次要等位基因的两倍体个体纯合在表中用 2 表示，而杂合子用 1 表示。最常见的等位基因的纯合子用 0 表示。

需要更多信息？有问题？从 JMP 用户社区得到解答 (community.jmp.com).