高通量DNA测序数据的分布密度分析及其应用

被引量 : 0次 | 上传用户:odu38sbfsw
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
高通量测序技术可以在短时间内完成全基因组深度测序,通过对个体的全基因组或组织细胞内的全体mRNA进行高通量测序得到的测序数据在参考基因组不同区域上的分布密度差异进行分析,可以直接探究个体基因组序列异常和基因表达异常,这种诊断方法采样方式简单安全,对个体医疗的发展有着重要意义。这也为测序数据分布密度的精确分析和合理利用提出很高要求。本文主要工作是设计出一种参考模板生成算法来生成更适用于分布密度分析的参考模板。然后对测序数据在该参考模板上进行比对得到的比对分布数据设计系列分析算法。比对分布密度分析算法一方面用于定量分布密度误差,另一方面用于更好地掌握比对分布数据规律。本文最后在此基础上针对胎儿染色体数目异常方面的应用设计了一个经过改进的产前诊断系统。在本论文中,先是提出一种参考模板生成算法,用该算法生成参考模板,通过去重复来提高测序数据在参考模板上的比对速度,并且可以保证测序数据的比对数量和比对分布密度的精度。之后,本论文对比对分布密度展开系统分析。一方面,本论文用不同的GC含量偏差模型来分析GC含量对比对分布密度的影响,用于确定准确反映数据规律的GC含量偏差模型和最佳参数,进而构建GC含量偏差校正模型,以消除GC含量对比对分布密度带来的偏差。另一方面,本论文致力于对不同样本的染色体表达率进行一系列分析,在分析样本在不同染色体上所呈现出的表达率差异基础上,分析胎儿性别不同和处于不同孕期的母体血浆DNA测序数据在人类染色体组上的表达率差异,阐明胎儿性别和所处孕期对样本测序数据的染色体表达率的影响规律。最后,本文针对胎儿染色体数目异常的产前诊断设计出一个经过改进的诊断系统。该系统对孕妇血浆DNA测序数据在本论文生成的参考模板上的比对分布数据进行分析,用于诊断胎儿染色体数目异常。而该系统中GC含量偏差校正模块的加入减小了样本染色体表达率的偏差,提高了染色体表达率计算的准确度。
其他文献
作为美国当代作家阵营中独具魅力的领军式人物,唐·德里罗以其独特的视角和犀利的笔触,“复刻”了美国后工业时代人类的生活现状,同时启示大众如何在斑斓复杂的当代美国社会中寻
2018年5月8日—11日,全国妇联党组书记、副主席、书记处第一书记宋秀岩先后到陕西延安、咸阳、杨凌、西安等地,调研妇联组织改革及其发挥作用情况。看到基层妇联组织"扩容强体
期刊
<正> 座疮,又称暗疮、青春痘、青春蕾、青春疙瘩。好发于面部、上胸部、肩胛间。初为毛囊性小丘疹,顶端有黑色栓塞物,刚手挤压后可排出牙膏样乳酪物,严重者可有脓疤、结节、
期刊
宫廷文学是以帝王(包括诸侯)的宫廷为流行场所,由帝王本人及其御用文人、乐师和一些朝廷大臣创作的,主要是描写宫廷活动和宫廷生活,用以歌功颂德、点缀太平、娱乐享受和表达讽谕
目前能源的生产与消耗在我国经济发展的大趋势下呈现出越来越大的矛盾。尤其是随着人们生活水平的不断提高,人们对居住舒适度的要求也在不断提高,我国的建筑能耗总量的上升趋势
近年来,北京市郊区对农村集体经营性建设用地集约利用开展创新性探索,创造了乡镇统筹集约利用集体经营性建设用地的新模式。乡镇统筹集约利用集体经营性建设用地的的核心是建
严重海杂波中的目标检测是十分具有挑战性的检测问题之一。传统检测手段很难进一步提升雷达系统的检测性能。利用环境和目标特征信息自适应地调整发射波形,形成动态闭合系统,可
“三北”地区电网的电源结构中,煤电所占比例较高,缺乏调节性能好的水电电源,随着风电并网容量的不断增加以及峰谷差的加大,系统调峰压力越来越大;热电联产机组由于其生产效率高、
从包装设计的创意分析、定位分析和包装的视觉表现3个方面,阐述了设计师在包装设计过程中应考虑的因素。通过设计表现以视觉可以认知的形态传递商品信息。使包装在市场流通环
绿色技术社会融合的本质是绿色技术系统与社会政治、经济、文化要素之间的相互渗透和适应,其目的是实现绿色技术系统与社会系统在实践中的最优整合。由于各种原因,绿色技术在