基于并行测序数据的STR分型流程

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:lzhongyue
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
STR是重要的多态性分子标记,在法医遗传学中常被用于个体认定或亲缘关系分析。随着大规模并行测序技术的不断发展,越来越多的法医实验室将这种技术应用到法医科学中。现有的STR分型工具,大多数是针对全基因组测序数据开发的,对并行测序数据并不适用。更重要的是,这些工具与传统毛细管电泳方法的兼容性尚未得到充分评估与保证。在本研究中,我们开发了一套端到端的分析流程STRsearch,用于并行测序数据中的STR分析。一方面,STRsearch可以通过对STR区域中实际存在的重复单元,以及插入或缺失碱基进行计数来确定STR等位基因;另一方面,其可以将并行测序结果转换为标准STR命名法(数字和字符的形式)。我们在两个法医测序数据集中评估了STRsearch的性能,与毛细管电泳法的结果比较,得到的一致性分别为75.73%和75.75%,比现有分析工具STRScan分别提高了12.32%和9.05%。此外,我们使用多个测序属性作为特征,训练了一个基础分类器,以预测在给定STR位点进行正确分型的概率,最佳模型的预测准确性为96.13%。这些结果表明,STRsearch能更好地保证与毛细管电泳方法的兼容性,因此是并行测序数据中STR分析的更优工具。STRsearch作为开源软件可在https://github.com/An Jingwd/STRsearch下载获得。
其他文献
学位
学位
学位
学位
学位
学位
学位
学位
学位
学位