基于深度学习的蛋白质金属离子结合位点预测方法研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:ybchen123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质通过与其他配体分子的相互作用来执行其功能。目前发现一半以上的蛋白质与金属离子有结合位点,金属离子既稳定了蛋白质结构又调节了蛋白质的生物学功能。例如,金属铁离子(Fe2+)与血红蛋白的结合对于其通过血液携带和转移氧气的功能致关重要。金属Zn2+离子与核酸酶和转录因子的结合在锌结构域的行成中起着至关重要的结构作用,因此准确识别蛋白质离子结合位点对于理解蛋白质功能机制和发现新药非常重要。蛋白质与金属离子蛋白质结合位点的预测,本质上属于蛋白质残基水平的预测。在3D结构中作为邻居的残基在序列上可能相距很远。这些局部或非局部依赖性对于残基级别的属性预测至关重要。为了对这些依赖性进行建模以提高预测性能,采用ACNN+GRU混合深度学习方法捕获局部依赖特征和长相关性特征。ACNN学习蛋白质序列的局部依赖特征,使用GRU学习蛋白质的长依赖特征。然后对融合特征进行分类,直接得到该蛋白质序列上结合位点的预测结果。混合深度学习模型是一个端到端模型,不需作人工特征筛选,不需要进行数据预处理和后处理。输入蛋白质序列,即可得到对应的蛋白质序列预测结果。为了解决蛋白质结合位点和非结合位点数据不平衡的问题,改进了交叉熵函数损失函数使得它既能平衡正负样本又能关注难样本和错分样本。在提取的金属离子数据集上,按8:1:1的比例划分数据集,最终在测试集上性能指标较其他方法均取得了较大的提升。在训练集上各项指标均优于以前的方法,在测试集上大部分离子的Pr均高于对比方法20%左右,ACC和Sp也高于10%左右。本文的模型使用MCC、Precision、Accuracy、Sp、Sn作为评估标准。
其他文献
随着国内外机器人行业的快速发展,足式机器人、轮式机器人、履带式机器人等各具特色,应用环境和背景各不相同。足式移动机器人:具有优良的环境适应能力和的灵活性,能够进入人类生活,与人类共同工作,从长远来看,足式机器人在诸如大众服务行业、教育、医疗、无人工厂、宇宙探索等都有着潜在而又广阔的应用前景。优点:地形适应能力,并且更加灵活,翻越峭壁和陡坡等障碍物。缺点:承载能力不强,在某些地貌,其行走效率很低。轮
中国是当今世界第二大经济体,改革开放以来经历了快速城市化过程,城镇用地作为社会经济发展的载体,近年来扩展特征明显,在带来巨大经济效益的同时,其无序蔓延也威胁着区域的生态环境和粮食安全。缺乏对城镇空间的合理规划与管理将导致城镇用地盲目向周边摊大饼式的扩延,可能会带来生态系统服务功能衰退、耕地质量下降、土地资源浪费等一系列城市问题。因此,有必要将保护生态环境与保障粮食生产的任务纳入未来城镇用地的布局规
芷江鸭是湖南省芷江县的一道传统名菜,深受人们欢迎,随着我国肉制品深加工产业不断发展,“芷江鸭”袋装熟食产品应运而生,但在生产中经过杀菌处理的“芷江鸭”风味与即炒即食的“芷江鸭”有较大差别,影响了芷江鸭产品的销售。因此,本文以芷江鸭为研究对象,通过研究加工工艺对芷江鸭风味的影响,优化加工工艺参数,改善常温包装“芷江鸭”产品的品质。本文采用HS-SPME-GC-MS技术,建立了芷江鸭挥发性风味物质的H
现在的半导体器件尺寸逐渐减小,工艺流程愈发复杂,使传统的电荷陷阱型存储器面临着电荷泄露增大、保持特性变差等问题。利用缺陷工程,简化电荷陷阱型存储器的制备工艺,能够有效地改善器件的保持特性,降低器件的功耗等。本论文主要通过氮等离子体处理与氧空位的形成两种方式制备富含缺陷的电荷存储层,并结合第一性原理进行理论分析,探究了不同缺陷的引入方式对电荷陷阱型存储器的性能影响。在氮等离子体处理方面开展了以下研究
选矿行业是流程工业的一个典型代表,具有多工序、设备复杂、生产线长的特点。选矿生产过程中设备的使用流程是固定的,一旦生产线中某一设备发生非正常停机或严重故障,对于后面的生产流程将造成严重的影响,因此需要对设备进行全生命周期的监控。为了保证选矿厂设备的安全稳定运行、减少设备的非正常停机、提高企业的生产效率、降低生产成本,有必要开发出满足选矿厂运行要求、功能完善、性能稳定的选矿设备监控系统,使其能对选矿
区块链技术是数学、密码学、经济学等多学科融合的结果,具有去中心化、分布式记账、公开透明、不可篡改等显著特点。传统审计行业有着工作量大、重复性高的特点,区块链技术的应用使得交易信息记录的交互模式由中心化发展至分布式阶段。这一新技术在推动交易记录与审计效率的大幅提升、解决现有的复式记账法可信度问题的同时,也对现有审计行业造成了冲击。区块链技术的兴起,加大了审计应用上的研究与开发的投入,对未来审计行业的
合理利用再生水等非常规水资源可缓解南方地区因社会经济发展所致的区域或季节性缺水问题。本文探究低矿化度高钠吸附比盐溶液对土壤水力与流出液性质的影响,通过测定土壤水分特征曲线分析水分运动及保持变化规律。选取红壤、水稻土、紫色土、潮土为研究对象,采用Na Cl和Ca Cl2 2种工业盐配制不同钠吸附比(Sodium adsorption radio,SAR)低盐溶液淋溶处理土壤(文中划分SAR0、SAR
2020年,新冠肺炎疫情突然爆发,对中国乃至全世界来说都是一次巨大的考验,面对全然未知的病毒类型,中国政府反应迅速,以壮士断腕的决心和勇气果断采取措施,阻断疫情传播链条,以最快速度遏制住疫情蔓延势头,为人民打开了生命通道,在没有经验可以借鉴的情况下,我国政府顶住疫情迅速蔓延的巨大压力,在不断摸索中前进,找到适合中国国情的应对方式,走出属于中国特色的治理道路,但在这一过程中,仍然存在许多不可忽视的问
龙门山前带地区地表起伏剧烈,表层岩性变化大,地震资料信噪比低,静校正问题突出,是典型的复杂山前带地震勘探区域。针对该地区表层结构的特点并结合实际资料进行研究,应用多信息约束层析静校正技术,对比分析了有无约束条件下的近地表建模精度与静校正效果差异。应用结果表明,多信息约束层析反演后既能增加模型射线密度,精确反映浅层反射结构细节,又能很好地描述高速层顶界面的构造,得到空间结构变化合理且垂向分辨率更高的
随着计算机行业的快速发展,各式各样软件的出现使得人们的生活变得更加智能化,但与此同时也出现了许多隐藏的安全威胁。许多恶意攻击者们会通过漏洞植入恶意行为来窃取用户隐私信息等实现其不合法目的,随着代码混淆工具的越发成熟,更多的混淆技术被恶意攻击者用于恶意软件躲避安全防御系统的检测查杀,这极大增加了逆向分析的难度和开销。基于对抗生成网络(GAN)的抗混淆二进制相似性检测模型,能够生成绕过当前抗混淆检测模