论文部分内容阅读
蛋白质-蛋白质之间相互作用在细胞功能的各个方面如新陈代谢和信号传导中起着至关重要的作用。对蛋白质相互作用的分子机制的研究表明蛋白质界面上小部分残基对结合自由能的贡献很大,并且它们对维持蛋白质的稳定起着积极的作用。鉴别蛋白质作用界面的热点残基对于药物设计和研究癌症具有非常重要的意义。目前,通过生物实验技术来发现热点残基的方法,因其代价高不能被广泛的应用,因此,需要利用机器学习的方法来研究热点残基预测的问题。本文提出了一种可靠的热点残基预测的方法。针对每个残基,本文提取108种序列、结构和残基的微环境特征(包括传统的特征以及本文中提出的伪疏水性特征)。然后利用两步特征选择法,包括最小冗余最大相关性算法和穷举法,选择出最佳的3个特征。本文利用支持向量机来构建模型。和其他预测方法比较,本文的预测结果是最好的,F1和MCC分别达到了0.70和0.46。预测结果表明,通过本文的方法选取的3个特征比那些传统的特征更加有效,同时表明,结构和物理化学方面的特征是区分热点残基的重要特征。