论文部分内容阅读
从序列出发预测某蛋白质是否为脂肪酶以及属于哪种脂肪酶具有重要的理论和应用价值。提出了基于Z标度和T标度的伪氨基酸组成方法提取序列特征值,采用了k-近邻算法回答上述问题。经参数选择后,三种方法在各自最优运行参数下,其10倍交叉验证的结果为:对脂肪酶和非脂肪酶预测精度分别为92.8%、91.4%和91.3%:对脂肪酶类型预测的精度分别为92.3%、90.3%和89.7%。其中基于Z标度伪氨基酸组成效果最佳,基于T标度的次之,但均明显优于其他6种常见的特征值提取方法,并对其可能的原因进行了探讨。