论文部分内容阅读
谷类作物种子的整个发育过程是在母体植株上完成的,母株为种子提供库容和营养,因此种子胚乳性状和胚性状的遗传表达除了受胚乳和胚自身基因型控制以外,还可能受到母株基因型影响。尽管当前已有学者提出一些专用的胚乳性状QTL作图方法,但这些方法均忽略了种子性状遗传表达中可能存在的母体效应。为此,本文根据胚乳性状和胚性状的遗传表达特点,提出了一种新的包含母体效应的种子性状QTL区间作图方法。该方法采用基于EM算法实现的极大似然分析方法估计QTL的遗传参数。基本过程如下:(1)利用分离群体的分子标记基因型信息,推断种子胚以及胚乳基因型的条件概率;(2)依据贝叶斯公式,利用QTL基因型的条件概率和种子性状表型观察值计算各QTL基因型的后验概率;(3)根据后验概率计算有关缺失变量的条件期望,再由条件期望获得遗传参数的估计值;(4)重复2、3两步直到收敛为止,收敛时的参数估计值即为相应参数的极大似然估计值。由于种子基因型和其着生的母株基因型均可能对种子性状产生影响,因此,在种子胚以及胚乳性状的表达中要同时考虑亲子两代的QTL基因型,即QTL联合基因型。本研究考虑两种不同的分子标记信息利用方案。方案1是仅利用分离群体母株的分子标记基因型推断该植株上自交种子胚或胚乳的QTL联合基因型;方案2则同时利用母株的分子标记基因型以及母株上自交种子胚的分子标记基因型共同推断种子胚或胚乳的QTL联合基因型。在此基础上,我们针对胚乳和胚的遗传特征分别发展了适用于胚乳性状和胚性状的QTL作图方法。方法的可行性和有效性通过计算机模拟数据进行分析验证。本文模拟研究供试因素包括:QTL遗传力、分离群体植株数以及每株测定的种子数。每一处理均重复模拟100次。考察指标包括:QTL的统计功效以及QTL位置和效应估计的准确度和精确度。模拟研究如下:方案1:仅利用母株的分子标记基因型本方案仅需提供母株的分子标记基因型以及种子性状表型观察值即可完成全部分析。鉴于胚乳和胚之间存在倍性差异,我们针对该二类性状分别给出了不同的分析模型,并分别进行模拟分析验证。胚乳性状研究中共采用了3个供试因素不同水平组成的36个处理组合。模拟结果表明:(1)本文提出的包含母体效应的种子性状QTL作图新方法在胚乳性状作图中均具有较高的统计功效,36个模拟处理中,新方法仅对5个处理未能发现全部QTL,其余31个处理的QTL统计功效均达100%。此外,100个F2植株、每一植株仅测定10粒胚乳,新方法即有100%的统计功效发现遗传力仅为5%的QTL。(2)新方法在不同的QTL表达模式下均能够准确估计潜在QTL的所有遗传效应,有效地避免了因模型缺陷所导致的参数估计值系统偏差。例如,200个F2植株、每一植株测定20粒胚乳,无论是对遗传力较大的QTL还是遗传力较小的QTL均有较好的检测效果以及QTL位置与效应的较精确估计。胚性状研究中共采用了3个供试因素不同水平组成的12个处理组合。各处理按3种模式产生模拟数据,对应胚性状的不同表达方式,包括组成型表达(模式1)、仅在植株组织中表达(模式2)和仅在胚中表达(模式3)。每套模拟数据分别使用本文提出的新方法(方法I)、忽略胚遗传效应的母体效应模型方法(方法II)和忽略母体遗传效应的胚效应模型方法(方法III)进行分析。模拟结果表明:(1)在3种表达模式下,方法I的QTL发现能力均稍高于方法II和III。例如,对于遗传力为10%的QTL,同样采用500个植株、每株单粒测定20粒胚,模式1下,仅方法I可以准确估计潜在QTL的所有遗传效应,方法II和III的估计值均与设定的真值有较大的偏差;模式2下,方法I和II的参数估计值与真值相近,而方法III的遗传效应估计值存在系统偏差;模式3下,方法I和III的估计值接近真值,方法II则无法准确估计相应的遗传参数。(2)除遗传力和样本容量之外,QTL的表达模式同样会影响其被检测效率。当母体效应在胚性状的变异中占据更大的比重时,QTL更容易被检测。例如,同样利用100个F2植株的分子标记基因型和每株5粒胚性状观察值,对于遗传力为5%的QTL,3种方法的统计功效在模式1下分别为77%,74%和75%;在模式2下分别为81%,81%和80%;在模式3下分别为27%,18%和18%。方案2:同时利用亲子两代分子标记基因型由于方案1的QTL联合基因型是根据母体QTL基因型间接获得,而非由分子标记基因型直接推断。为了消除或减小子代QTL基因型对母体QTL基因型的依赖,我们进一步提出利用母株和胚两代分子标记基因型联合推断QTL基因型的作图方法。该方法较方案1更为复杂,应用中需要同时提供母株和胚的分子标记基因型以及种子性状的表型观察值。方案2的模拟研究同样针对3个供试因素设置了12个处理,各处理分别采用方案1的胚性状模拟研究中的3种方法进行分析。模拟结果表明:(1)子代自身分子标记基因型信息的使用进一步提高了QTL联合基因型推断的准确性,从而分析具有更高的统计功效。例如,如果仅利用单世代的标记信息,对比本研究的12个处理,胚乳性状和胚性状分别有1个处理和2个处理未能发现全部QTL;而利用两代分子标记基因型联合推断QTL联合基因型的作图方法,在供试的所有处理的统计功效均达100%。(2)本方案所有遗传参数估计值的标准差均小于方案1下的相应结果,说明利用亲子两代标记基因型联合推断QTL联合基因型的方式在一定程度上减小了子代QTL基因型推断对母体QTL基因型的依赖,从而显著提高分析结果的可靠性。然而,由于自花授粉植物亲子两代间的基因型本来就存在相关性,且即使采用两代分子标记基因型的信息亦不能从先验信息上区分胚乳的两种杂合基因型,因此胚乳性状两个显性效应只有在相对较大的样本容量下才能被准确估计。