论文部分内容阅读
核糖核苷酸(ribonucleic acid, RNA)作为一类生物大分子在遗传信息表达过程中扮演连接DNA与蛋白质的重要角色,具备催化和基因表达调控等功能。RNA分子结构对RNA功能具有重要影响。由于采用物理实验方法测定RNA分子结构成本较高,RNA二级结构算法模拟预测成为重要研究途径。假结是由茎区交叉嵌套形成的RNA分子结构的子结构。由于假结结构异常复杂,其预测问题成为RNA二级结构研究重要内容。论文将禁忌搜索和布谷鸟搜索应用于带假结RNA二级结构预测研究,通过设计面向所有类型假结的自由能量函数建立目标函数,针对禁忌搜索和布谷鸟搜索提出算法改进设计,通过仿真预测实验表明所提算法的可用性和有效性。论文主要工作包括:1.提出一个基于禁忌搜索的带假结RNA二级结构预测算法。算法基于自由能量模型建立目标函数通过最小优化进行结构预测,利用集中性搜索探索当前解相邻空间,引入扩充性搜索提高解多样性,提高算法搜索能力。算法与STAR、HotKnots和RnaPredict等现有算法通过对烟草花叶病毒、甜菜黄化病毒等13条RNA序列进行预测比较,所提算法在H型假结序列上的平均敏感性和确定性指标达89.77%和89.03%,在非H型假结序列上的平均敏感性和确定性指标达63.56%和63.41%,在全部序列上的平均敏感性和确定性较对比算法提高5.65%和8.63%,算法平均预测时间效率较RnaPredict算法提高20.35倍。2.提出一个基于布谷鸟搜索的带假结RNA二级结构预测算法。算法将禁忌机制和自适应参数引入布谷鸟搜索,改进鸟巢搜索和弃蛋搜索功能,以最小自由能量为目标函数组合茎区预测RNA二级结构。算法与STAR、HotKnots和RnaPredict等现有算法通过对小鼠乳腺肿瘤病毒、人抗丁型肝炎病毒抗体等13条RNA序列进行预测比较,所提算法在H型假结序列上的平均敏感性和确定性指标达94.23%和93.06%,在非H型假结序列上的平均敏感性和确定性指标达71.17%和77.04%,在全部序列上的平均敏感性和确定性较对比算法提高10.21%和17.03%,算法平均预测时间较RnaPredict算法提高11.28倍。