卵巢癌相关长链非编码RNA的生物信息学研究

来源 :南京航空航天大学 | 被引量 : 0次 | 上传用户:woaiyan0
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
卵巢癌是女性生殖系统最常见的恶性肿瘤之一,因其早期症状不明显,将近60%的卵巢癌确诊时已处于晚期,死亡率极高。因此,卵巢癌的早期发现是有效治疗的关键。此外,由于卵巢癌术后的高复发转移率以及化疗耐药性,卵巢癌(特别是卵巢浆液性囊腺癌)的预后极差,居所有妇科恶性肿瘤之首。为了研究卵巢癌早期诊断和临床治疗方法,需先了解其发生发展以及耐药性产生的分子机制。目前,利用高通量测序技术,已经发现了大量在卵巢癌中表达失调的长链非编码RNA(lnc RNA),但大多数lnc RNA在卵巢癌中的功能及作用机制尚不清楚。lnc RNA具有高度的组织和时空表达特异性,功能多样,已成为卵巢癌领域的研究热点。随着近些年卵巢癌转录组学数据的积累以及癌症基因图谱(TCGA)计划的实施,我们得以通过系统生物学及生物信息学的方法识别卵巢癌相关lnc RNA,构建lnc RNA调控网络,深入探讨lnc RNA的功能及其在卵巢癌中的分子作用机制。本文的主要创新性工作如下:1、目前基于高通量测序数据的转录本组装还存在装配质量不佳,起始或终止密码子丢失等问题,使得不完整编码转录本易被错分为lnc RNA。因此,我们提出了一种新的lnc RNA识别工具–lnc Score。该工具在准确区分lnc RNA和m RNA方面要优于其他工具(如CPAT、CNCI等),特别是在不完整编码转录本的分类上,识别准确率95%以上。lnc Score还具有支持多线程,耗时短,效率高等优势。此外,我们提取了卵巢癌及癌旁组织并进行了转录组测序,从组装的转录本中利用lnc Score识别出5821个新的lnc RNA转录本和4611个新的lnc RNA基因,其中10个新的lnc RNA转录本和174个新的lnc RNA基因被发现在卵巢癌中差异表达。2、针对现有方法基于整体表达相关性对lnc RNA-mi RNA-m RNA竞争性三元组进行筛选,受样本集影响较大,且仅能筛选mi RNA中心型候选三元组等问题。我们提出了一种新的竞争性三元组识别工具–Lnc Mi M。该工具利用改进型的滑动窗口方法,基于局部水平的表达相关性变化,可对三种中心型候选三元组进行筛选,不仅降低了竞争性三元组识别的假阳性率,还提高了识别的敏感性。基于TCGA数据库中373个病人的卵巢癌高通量测序数据,我们使用Lnc Mi M识别出的竞争性三元组构建了lnc RNA调控网络,并对其功能进行了分析。结果显示该调控网络与卵巢癌细胞的增殖、分裂及迁移密切相关。3、RNA中含有的内部核糖体进入位点(IRES)功能元件,通常介导非帽依赖的RNA翻译机制,近来其被发现在癌症的形成和发展中发挥着重要作用,迫切需要一个完善的IRES功能元件数据库。因此我们从文献中手工收集了所有实验验证的IRES元件,并构建了一个新的IRES数据库–IRESbase。该数据库收录的IRES条目共有1184个,数量比其他数据库多八倍,且注释信息更加丰富,特别是提供了人类IRES元件的基因组位置信息。基于TCGA数据库中的卵巢癌高通量测序数据,我们分析了lnc RNA与含IRES元件m RNA间的相互作用,筛选出110个与含IRES元件m RNA表达相关的lnc RNA,并对其潜在功能进行了预测。结果提示这些lnc RNA可能通过调控细胞周期及代谢过程影响卵巢癌细胞增殖,通过调控Slit/Robo信号通路影响卵巢癌细胞迁移。4、目前尚有大量的人类RNA中的IRES元件未被发现,而实验的方法往往耗时耗力。因此,我们提出了一种新的IRES元件识别工具–IRESfinder。该工具在训练集中使用的正负样本均取自IRES活性鉴定实验,并首次使用了改进的k-mer特征--Framed k-mer。与现有工具相比,IRESfinder对真核RNA中IRES元件的分类准确性更高,鲁棒性更强。通过对卵巢癌及癌旁组织的转录组测序分析,共找到23个差异表达的lnc RNA转录本。随后使用IRESfinder对这些差异表达lnc RNA中的可能存在的IRES元件进行了预测,由此筛选出7个可能编码多个小肽的lnc RNA,功能分析表明其与卵巢发育密切相关。本论文主要基于卵巢癌高通量转录组测序数据,利用lnc Score识别新的卵巢癌相关lnc RNA,接着使用Lnc Mi M构建lnc RNA调控网络,然后通过研究lnc RNA与IRESbase数据库中IRES元件宿主m RNA间的相互作用分析lnc RNA在卵巢癌中的潜在功能,最后使用IRESfinder辅助卵巢癌相关编码小肽lnc RNA的识别。本文研究成果将有助于理解lnc RNA调控网络影响卵巢癌发生发展的分子机制,对卵巢癌的早期诊断和靶向药物的研发打下良好的科学研究基础。
其他文献
智能集群化是当前无人机领域的重要发展方向,相对导航与定位作为其中的核心技术是无人机完成任务的关键。这其中包含两层含义,其一是获取无人机之间的相对导航信息可以保证自主编队飞行的一致性和安全性;其二是多机通过配置不同的传感器载荷实现能力互补,共同对目标进行相对定位,可以提升无人机的任务能力和整体效能。本文针对多机协同相对导航中这两个方面的问题展开研究,在综合分析相对导航系统需求的基础上,研究了基于多源
2021年是中国共产党成立100周年,是实施"十四五"规划、开启全面建设社会主义现代化国家新征程的第一年,也是中央和国家机关党的建设质量提升年。一年来,中央纪委国家监委机关坚持以习近平新时代中国特色社会主义思想为指导,以贯彻落实习近平总书记在中央和国家机关党的建设工作会议上的重要讲话精神为主线,以党的政治建设为统领,突出庆祝中国共产党成立100周年,扎实开展党史学习教育,巩固深化"不忘初心、
期刊
薄膜、表面涂层、纳米结构材料、微机电系统、功能梯度材料等先进的材料系统由于其优异的物理、化学、力学性能,在精密器械制造、生物工程等领域得到了越来越广泛的应用。如何表征这些材料系统的力学属性显得尤为重要,由于试件的尺寸与测试设备的局限性,使用传统的力学检测技术对这些材料系统已经失效。仪器化压痕试验技术的出现,解决了薄层材料属性检测的难题。仪器化压痕试验技术,又称纳米压痕技术,是由计算机控制压痕试验中
信赖域方法是非线性优化的一类重要的数值计算方法.该方法有很好的稳定性和很强的收敛性.传统的信赖域算法主要是利用二次模型来逼近目标函数,然而对于非二次性态强、曲率变化较为剧烈的函数,逼近的效果往往不是很好.针对这一缺陷,Davidon首先提出了锥函数.使用锥模型去逼近的效果可能好于二次模型,但其水平向量参数只有一个,这会影响其搜索方向的选择.因此,本文考虑二次模型和锥模型的推广形式—分式模型.它含有
先进的高超声速飞行器能够在高速飞行过程中自主控制飞行轨迹。在非巡航状态下,非定常气动力、气动热以及结构振动的相互作用可能引发热颤振问题。论文从流场计算、结构温度场计算、结构振动瞬态响应分析等方面围绕非巡航状态热颤振计算方法开展研究,发展了基于“冻结”模态方法和基于多场瞬态耦合方法的高超声速飞行器非巡航状态热颤振计算方法。基于有限体积法建立了高超声速流场-结构温度场同步计算方法。采用双时间推进法求解
受益于Kriging代理模型以及EI(Expected Improvement)最优更新策略的应用,EGO(Efficient Global Optimization)全局优化算法能够在不失全局性的基础上,显著减少目标函数的评估次数,从而极大地提高优化问题的优化效率,近年来被广泛地应用于气动外形优化等目标函数评估十分费时的优化问题中。但也正是因为Kriging代理模型的存在,EGO算法在优化后期较
在大规模地震救灾、大规模战场物资补给等场合,紧急补给物资的快速精确空投对及时满足地面人员的需求至关重要,引起了美、欧等国家和地区研究人员的极大兴趣。现有单个翼伞装备了GPS、INS及其它板载传感器,可利用测得的状态,通过跟踪规划航迹自主导航到目标点,因此现有翼伞已具备了自主归航能力,某种意义上可视为自主智能体。目前对翼伞的研究主要还是集中于单个翼伞的建模、航迹规划、航迹跟踪,但实际空投任务中往往需
Web服务作为一种基于Internet的分布式计算模型,适合作为一种独立而开放的实体在互联网环境中发布和使用。单个Web服务的功能往往有限,为实现更为复杂的业务逻辑,可以通过有效集成分布在Internet上的Web服务以形成功能更为强大的组合服务。用户为使用服务提供的功能,需要提供必要的个人隐私信息。然而,由于Web服务开放、动态和自治的特点,隐私信息一旦被收集,用户就难以控制服务如何使用和暴露这
随着机器人技术的进步与发展,机器人的应用领域变得更加广泛。从自动化车间装配至深海作业乃至太空的无人操作,都迫切需要机器人担任角色去执行更多更复杂的任务。为了满足复杂任务的作业需求,利用已有机器人,构建多机器人协调系统作业的模式势在必行。从研究的角度看,多机器人协调研究相较于单机器人涌现出了许多全新的问题,例如:多机器人的协调模式、选型、布局、轨迹规划及控制方法等问题。本文针对自动化车间大体积、重型