论文部分内容阅读
在后基因组时代中,研究蛋白质的空间结构具有极其重要的意义。弄清蛋白质的结构进而理解结构与功能的关系具有重要的意义,对其研究可为疾病的早期诊断,药物的精确筛选等提供方案。现代医学对蛋白质进行了各种结构预测,可分为二级结构预测和三维结构预测,其中蛋白质二级结构预测是整个蛋白质三维结构预测中重要的一环。其对蛋白质空间结构和功能的研究能够起到很大的作用。蛋白质二级结构预测问题的关键是建立起氨基酸序列与二级结构之间的对应关系模型。本文利用神经网络对蛋白质的二级结构进行了预测研究。神经网络是一种广泛被人们用于蛋白质二级结构预测上的模型,与此同时也由于其容易出现局部极值和收敛速度慢的问题,导致预测准确率一直不高,很难达到满意的效果。本文通过对神经网络进行优化,提高了蛋白质二级结构的预测精度。具体的优化方法包括遗传算法以及粒子群优化等。并针对单个神经网络的不足,设计出一种复合神经网络模型。本文基于BP神经网络模型,对蛋白质二级结构进行了实验预测,并且对不同的特征序列提取方法进行了研究。由于目前BP网络的预测精度不是很理想,因此文中对BP算法进行了各种改进尝试,并取得了一定的效果。同时利用PSO算法来优化模型,成功地解决了该算法易产生局部极小值以及模型收敛速度慢的问题,有效提高了预测的准确率。为了进一步提高预测准确率,本文结合了遗传算法来改进神经网络的函数梯度下降法,提出了一种利用遗传算法改进的BP网络结构的预测模型,对25PDB数据集进行了仿真实验,最终本模型预测的精度达到了73.5%左右。传统的单个神经网络预测精度不高,本文利用5个BP网络设计出了一个两级的复合网络结构模型,并对传统的编码方法进行了改进。仿真结果表明,与单个神经网络相比,本文复合网络模型的预测精度有了较大的提高,最终的预测精度接近于78%,这也验证了复合神经网络相对于单个神经网络而言在蛋白质二级结构预测问题上更加具有优势。最终本文研究的表明,智能计算方法对蛋白质二级结构的预测准确率的提高是十分有效的,特别是经过算法优化和结构优化的神经网络,整个模型的蛋白质二级结构的预测准确率十分理想。