一种通过寡核苷酸多态性芯片识别基因型的方法

来源 :华东师范大学 | 被引量 : 0次 | 上传用户:da330136324
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现在,很多的基因型识别方法,如RLMM和CRLMM为AffymetrixSNP芯片的基因型识别提供了准确的识别方法。但是在小样本情况下,精确度会有很明显的降低,同时,当样本量改变时,同一样本的识别结果可能会不一致。而且这些方法由于使用了过多的预处理程序如数据归一化等其他复杂的统计方法,使得计算量非常大。在芯片密度越来越集中的今天,这个问题显得尤为严重。   本文提出一种针对AffymetrixSNP芯片的新基因型识别方法。采用两步法来节省得到识别结果的时间。在第一步无指导性阶段,该方法可以以极高的精确度识别出超过50%的SNPs。在第二步有指导性阶段,利用HapMap训练样本中等位基因频率等信息,通过修正马氏距离的方法,产生较好的分类识别结果。   在精确度方面,与最为流行的CRLMM方法有一定的可比性,而且在小样本情况下优于CRLMM。对于每一个识别出来的基因型,置信分数同时给出。在某种程度上,该算法是便于计算且独立于其他样本信息的。由于这种算法可以利用一种自适应机制,再不需要任何其他训练样本的情况下完成基因识别。更为重要的是,当有新的基因型信息出现时,基于HapMap数据的训练样本可以很方便的更新。自适应过程在样本量中等以上的情况下是非常有效的。
其他文献
在最近的几十年里,Banach空间理论及几何理论的研究得到了快速发展,特别是在严格凸性与光滑性、k-严格凸性与k-光滑性、k-强凸性与k-强光滑性等有关凸性与光滑性理论的研究进
设υ,b,κ,λ,t均为正整数,并满足t≤κ.一个部分平衡t-设计PBD(υ,b,κ;λ,O)是指一个序对(X,B),其中X是一个υ元点集,B是由X的b个子集构成的集族,X的这b个子集称为区组,并且这些区组的大小均
学位
本文主要研究的是紧量子度量空间中的Lipschitz代数(∮)的理想与子空间.通过处理(∮)的理想与C*-代数A的理想之间的一些关系,我们证明了对于(∮)的满足某些条件的理想I,有I=
本文主要讨论一类具有HollingⅡ和Allee效应的多时滞捕食系统,其中食饵具有Allee效应,此系统是根据实际情况和已有文献中相应的系统做出的合理推广.  第一章介绍了研究背景
Gorenstein投射模、Gorenstein内射模和Gorenstein平坦模分别是经典的投射模、内射模和平坦模的推广,它们拥有很多类似于经典同调模的性质,对于研究交换代数和同调代数起着重
近年来,混沌控制与混沌同步及其在保密通信,信息科学,航天航空等领域所显示的巨大应用潜力引起了人们极大的研究兴趣,并成为当前混沌研究的一个热点.在这篇论文中,我们主要研究了