基于网络的蛋白质RNA结合位点预测数据库

来源 :东南大学 | 被引量 : 0次 | 上传用户:shirleyzuo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质与RNA的相互作用在很多的生物学过程中起到了非常重要的作用。例如,RNA和蛋白质的相互作用不仅在蛋白质的合成,mRNA的加工,病毒的复制中起到重要作用,近期还发现在细胞的防御和发展性调控中意义重大。 RNA在蛋白质上的结合位点的识别,主要是通过生物物理学方法在体外研究和分析RNA蛋白质复合物。这些方法需要实验过程繁琐、耗费大量人力和财力。研究一种基于原始氨基酸序列就能够识别RNA蛋白质结合位点的计算方法,将为人们快速寻找和分析新的RNA在蛋白质上的结合位点提供有力的手段。目前,直接依靠氨基酸序列来预测蛋白质RNA或DNA结合位点是一个很大的挑战。机器学习技术,通过利用实验中已经明确的RNA蛋白质复合物数据,将为这种蛋白质RNA或DNA结合位点识别、预测和分类的提供一条可实现的途径。 本文采用支持向量机模型(SVM)来对蛋白质RNA结合位点预测。我们选取了蛋白质的3个特征,分别为蛋白质旁链pKa值、疏水性指数和氨基酸的分子质量。这些特征值都比较容易获得,得到了较好的预测特异性(69.84%)和敏感性(66.28%)。 本文利用训练好的SVM模型对PDB数据库中所有人类相关蛋白质氨基酸序列进行训练,预测出其中蛋白质RNA结合位点信息,加上蛋白质注释信息,构建了蛋白质RNA结合位点预测数据库。我们建立的基于网络的二级数据库为用户们提供了一个友好的交互界面(www.bioinf.seu.edu.cn/brediction database/),用户可以通过3种不同的查询方式查询到的数据信息包括蛋白质PDBID号、蛋白质序列信息、蛋白质关键字或词、蛋白质发现时间、蛋白质发现作者的信息、蛋白质化合物的信息、蛋白质分辨率、研究蛋白质结构所用的实验类型、蛋白质晶体分辨率、蛋白质晶体参数,以及蛋白质RNA结合位点预测等信息。
其他文献
特殊儿童是存在于我们生活中的一个特殊群体,随着我国经济与社会的发展,特殊儿童逐渐受到了公众和社会的高度重视,其教育也成为了政府关注的焦点问题.数学作为特殊儿童义务教
生物素AP-tag技术是指在目的蛋白的N端或C端加上由15个氨基酸(GLND IFEAQKIEWHE)组成的受体肽(acceptor peptide,AP)小标签,该小标签可被生物素连接酶BirA特异性识别,B irA酶可催
本文结合多年教学经验,对初中女生的情商教育作了粗浅的探讨.提出了三点建议:一是德育为本,加强初中女生人生观教育;二是励志为本,开启初中女生的心智;三是注重挫折教育,培养
诗词大赛的举行,使得古诗文又一次提升到一个新的高度.古诗文不仅是初中语文教学中的重点和难点,同时也是我国历史发展和文化传承过程当中的重要瑰宝.因此,教师不仅要在课堂
电子设备在日常生活中的应用越来越广泛,它们给人们的生活带来方便的同时也对人的身体产生影响,电磁辐射就是其中之一。生物体吸收的电磁剂量与其姿态密切相关,对不同姿态下
本文通过对荣华二采区10
期刊
初中阶段的学生普遍好奇心比较强而且好动,他们对于学习还有一定的抵触心理,在课堂上对复杂而且繁多的物理学习内容,他们是心有余而力不足.在这种学习情况下,他们很难对物理
在学习小学语文这门学科的过程中, 教材是我们要学习的重点内容. 尽管体裁、题材、风格等各有不同,但都是思想内容和语言形式的有机统一, 具有高度的思想性和艺术性.在传统教
在新时期的快速发展中,社会各界越来越注重教育行业的发展,这就对教育教学工作提出了更加严格的要求.在新课标的大背景下,高中英语教师既要注重学生语言知识和技能教学的提升
德育教育在新课程标准中有着十分重要的地位,作为数学学科我们也必须要重视德育教育.在教学中,我们要本着适时、适度和符合学生需求的原则,通过挖掘教材、设计课堂环节、开展