基于理化特征融合的蛋白质亚细胞定位预测

来源 :济南大学 | 被引量 : 3次 | 上传用户：lhww123

【摘要】

：

蛋白质是生命的物质基础,参与众多的生命活动过程,包括DNA复制、转录、翻译、物质代谢、信号传导和细胞周期控制等,它是生命现象的直接体现者。因此,蛋白质功能研究是蛋白质

【作者】

：

王路瑶

【出处】

：

济南大学

【发表日期】

：

2017年01期

【关键词】

：

蛋白质定位预测两性伪氨基酸组成新型特征提取方法特征融合规则多标签k近邻算法

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

蛋白质是生命的物质基础,参与众多的生命活动过程,包括DNA复制、转录、翻译、物质代谢、信号传导和细胞周期控制等,它是生命现象的直接体现者。因此,蛋白质功能研究是蛋白质组学领域的研究热点,然而蛋白质亚细胞位置决定了蛋白质功能。蛋白质只有被运转到特定的亚细胞中,才能参与细胞的各种生命活动,如果运转发生偏差,将会导致细胞功能紊乱,甚至会对生命安全构成威胁,因此蛋白质亚细胞定位的预测对研究蛋白质功能具有非常重要的意义。此外明确蛋白质亚细胞位点,对癌症病发机理的研究和靶细胞药物的发现都起到至关重要的作用。在一些关于蛋白质亚细胞定位预测的研究中,发现越来越多的蛋白质同时存在于两个或多个亚细胞位置上或者在多个亚细胞间移动以实现它的生物学功能。因此,蛋白质亚细胞定位预测的研究就由单位点蛋白质亚细胞定位预测逐渐转向多位点蛋白质亚细胞定位预测,并且它已成为生物信息学的一个研究热点。巨量蛋白质序列的出现给亚细胞定位预测研究带来很大挑战和困难,因此需要借助计算机技术实现蛋白质亚细胞定位的自动预测。而传统的蛋白质亚细胞定位预测方法通常分为四大步:第一步,构建蛋白质数据集,为顺利完成亚细胞定位预测提供可靠数据;第二步,蛋白质的特征提取,是亚细胞定位预测的关键步骤,而传统的方法制约着定位预测精度;第三步,预测算法的选取,选择恰当的预测算法是研究过程的最重要的一步,直接影响最后的预测结果;第四步,预测算法的评估,通过分析评估结果来确定特征提取方法和预测算法选取的好坏,以便于预测精度的提高。本文围绕蛋白质亚细胞定位预测,研究了蛋白质特征提取、亚细胞定位预测算法等。论文主要工作总结如下:(1)本文采用同时含有单位点蛋白质和多位点蛋白质序列的数据集,如Virus-mPLoc和Gpos-m PLoc两个数据集。(2)本文针对熵密度、伪氨基酸组成(PseAAC)和两性伪氨基酸组成(AmPseAAC)三种特征提取方法,开展了如下三个方面的研究。第一方面是改进两性伪氨基酸组成特征提取方法,并与两性伪氨基酸组成进行比较,评价改进方法的有效性。第二方面是改进特征融合规则,本文在简单的特征融合规则基础上,将熵密度所提取的20维特征向量取代两性伪氨基酸组成所提取的前20维向量,称之为特殊融合方法。第三方面是结合二肽组成模型和氨基酸指数分布模型(AAID)两种特征提取方法,提出了一种基于氨基酸理化特征的新型特征提取方法,同时蛋白质定位预测结果证明了该特征提取方法的有效性。(3)采用多标签k近邻算法(ML-KNN)作为预测算法,同时又考虑到数据不平衡的问题,使用改进版的多标签k近邻算法(wML-KNN)。(4)使用汉明损失、1-错误率、覆盖率、平均精确率和正确率5大评估指标对预测算法的进行评价。根据对预测算法的评价结果,可以证明选择的特征提取方法和预测算法在Virus-mPLoc和Gpos-mPLoc两个数据集上具有可行性,并取得了较好的预测精度。

其他文献

税率、逃税程度和税收收入关系的博弈分析

本文用博弈论的方法构建了一个征税人和纳税人的博弈模型，用数量推理的方法阐述了税率、逃税程度和税收收入之间的关系，分析了罚款率、被检查概率和实际所得等参数对最优税率点

期刊

博弈论模型税收收入

贸易开放对中国农业面源污染的影响及非线性效应研究

基于2002—2015年中国30个省份的面板数据,分别利用双向固定效应模型及面板门槛模型研究贸易开放和农业面源污染的关系。结果表明,农产品对外贸易依存度的提高显著降低了中国

期刊

农产品对外贸易农业面源污染STIRPAT模型

关于中国人才战略问题的思考

从中国留学生的年龄结构的演化,用人机制、企业文化等方面分析了中国在人才培养和引进上存在的一些问题。以美国各阶段颁布实施的移民法为例,阐述了与此密切相关的美国人才战

期刊

留学人才战略移民科技强国

“遗传信息的表达”教学误区

分子生物学的发展极大地丰富了遗传信息表达的内涵。高中教材内容明显滞后于学科发展,使得教师难以把握教学的"度",教学效果大打折扣。为了更好地把握这部分内容的教学,通过

期刊

遗传信息表达教学误区分子生物学

高效液相色谱-电化学检测器测定富硒酵母中硒代蛋氨酸含量

目的建立测定富硒酵母中的硒代蛋氨酸含量的高效液相色谱-电化学检测器检测法。方法色谱柱采用Agilent Eclipse plus C18柱(150 mm×3.0 mm,3.5μm),流动相为100 mmol/L柠檬

期刊

高效液相色谱-电化学检测器富硒酵母硒代蛋氨酸

漾濞县枇杷产业化发展的思考

近年来漾濞县各乡镇枇杷新品种引入种植面积不断增加，如何实现枇杷产业化发展目标，做大做强该产业．要做到科学规划，做好示范；增加投入，强化科技培训；因地制宜，实施优质安全生产等对策

期刊

枇杷产业规划因地制宜

湿热耦合下实心圆筒中的瞬态湿热应力场

传统的热传导理论(傅里叶理论)导致热传导的传播速度是无限大,这在物理上并不现实。在过去几十年间,非经典傅里叶热传导理论得到了发展。根据这些理论,湿度和温度的传播被认

会议

傅里叶理论扩散现象双曲抛物型湿热耦合线性理论Laplace变换

弹簧血压计改装有创动脉压测定装置的应用体会

期刊

弹簧血压计动脉血压

Rho激酶抑制剂联合弥可保治疗糖尿病周围神经病变的观察

目的:观察Rho激酶抑制剂联合弥可保治疗糖尿病周围神经病变的疗效。方法:对66例2型糖尿病周围神经病变患者随机分为治疗组与对照组,在常规给予糖尿病饮食和应用口服降糖药物

期刊

Rho激酶抑制剂弥可保糖尿病周围神经病变

基于CAD/CAM与NC加工验证的多面孔系反镗反锪研究

在传统制造方法中,对壳体类零件上大量背向螺栓连接沉头座的加工,一般需要经过多次装夹,而且往往需要人工干预才能够完成。这属于瓶颈工序,对生产节奏有很大的负面影响。为此

期刊

数控程序数控加工工序集中CAMCAD/CAM

基于理化特征融合的蛋白质亚细胞定位预测

其他学术论文