论文部分内容阅读
随着人类微生物组计划的迅速发展与应用,微生物之间的互作机制研究逐渐成为生物信息学领域研究的热点,它有助于人类在健康监测、疾病诊疗、个性化用药等方面取得巨大进展。第二代测序技术的发展,使得研究学者可以获取大量微生物群落和功能基因的数据,已经提出了很多实验或者计算方法来挖掘分析微生物相互作用,但是大多数方法预测得到的是微生物之间的两两相互作用。在本研究中,我们使用基于概率逻辑的方法来推断微生物的高阶相互作用,突破微生物交互的成对关系限制,研究微生物三者之间的复杂关系,并系统应用到人类微生物组计划的数据上。根据得到的微生物高阶相互作用构建高阶交互网络,基于三均匀超图的理论方法,我们研究了基于超图的特征对样本进行关键物种识别和样本分类方法,取得了较好的效果。主要的研究工作和贡献如下:
第一,基于概率逻辑提取微生物之间的高阶相互作用。本文使用基于概率逻辑的方法挖掘微生物的高阶相互作用,在人类微生物组计划提供的数据上发现了4367个微生物的高阶逻辑关系,这证明了高阶逻辑的普遍存在性。我们还比较了高阶逻辑类型在不同身体部位的分布异同。与经典的关联规则算法对比,实验结果表明概率逻辑方法比已有的关联规则方法更为有效。不仅能挖掘到频繁微生物之间的高阶相互作用,也能挖掘到稀疏微生物之间的高阶相互作用。而且能克服关联规则存在的大量冗余规则和内存开销过大的缺陷。通过分析微生物的代谢网络,我们发现微生物之间的资源交互对所得高阶相互作用具有一定程度的贡献,这解释了计算结果的生物学意义。
第二,基于三均匀超图分析的微生物关键物种识别和样本分类方法。目前的微生物交互网络大多都是两两关联的简单网络,而微生物高阶交互关系难以用经典图论分析方法来分析,但超图模型提供了这样一个很好的建模方法,能更好地可视化和描述微生物的复杂相互作用。本文通过三均匀超图来分析微生物高阶关系网络,融合超图节点的度与损失度来识别微生物高阶网络中的关键物种。为验证该方法的有效性和可用性,使用该方法将属级别的253种微生物标记为关键物种或非关键物种,将标记的数据集按1∶1分成训练集和测试集,利用监督算法LDA判别模型进行分类实验。计算超图的特征,包括中介中心性,接近中心性和特征向量中心性。最后使用节点移除法作为对照实验。实验结果表明,本文提出的融合方法比节点移除法能更有效地识别网络中的关键物种,基于超图的特征可以对样本进行有效的分类,准确率达到90.61%。
第一,基于概率逻辑提取微生物之间的高阶相互作用。本文使用基于概率逻辑的方法挖掘微生物的高阶相互作用,在人类微生物组计划提供的数据上发现了4367个微生物的高阶逻辑关系,这证明了高阶逻辑的普遍存在性。我们还比较了高阶逻辑类型在不同身体部位的分布异同。与经典的关联规则算法对比,实验结果表明概率逻辑方法比已有的关联规则方法更为有效。不仅能挖掘到频繁微生物之间的高阶相互作用,也能挖掘到稀疏微生物之间的高阶相互作用。而且能克服关联规则存在的大量冗余规则和内存开销过大的缺陷。通过分析微生物的代谢网络,我们发现微生物之间的资源交互对所得高阶相互作用具有一定程度的贡献,这解释了计算结果的生物学意义。
第二,基于三均匀超图分析的微生物关键物种识别和样本分类方法。目前的微生物交互网络大多都是两两关联的简单网络,而微生物高阶交互关系难以用经典图论分析方法来分析,但超图模型提供了这样一个很好的建模方法,能更好地可视化和描述微生物的复杂相互作用。本文通过三均匀超图来分析微生物高阶关系网络,融合超图节点的度与损失度来识别微生物高阶网络中的关键物种。为验证该方法的有效性和可用性,使用该方法将属级别的253种微生物标记为关键物种或非关键物种,将标记的数据集按1∶1分成训练集和测试集,利用监督算法LDA判别模型进行分类实验。计算超图的特征,包括中介中心性,接近中心性和特征向量中心性。最后使用节点移除法作为对照实验。实验结果表明,本文提出的融合方法比节点移除法能更有效地识别网络中的关键物种,基于超图的特征可以对样本进行有效的分类,准确率达到90.61%。