基于神经网络的癌症多亚型分类及关键致病基因选择

来源 :中国矿业大学 | 被引量 : 0次 | 上传用户:wyh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
癌症日益威胁着人类的生存和健康,可能以不同的形式发生于人体的不同部位,形成不同类型的癌症。即便同种类型的癌症也会由于不同的基因突变表现为不同的亚型,给常规的癌症诊断和治疗带来困难。为了能够给癌症患者制定合理有效的个体化治疗方案,准确地进行癌症多亚型分类,并确定相关关键致病基因至关重要。本文即针对现有的与癌症多亚型分类相关的生物信息学方法展开研究和分析,首先针对癌症多亚型分类和关键致病基因选择设计了零隐藏层神经网络—弹性网正则化的Softmax回归(Elastic Net Regularized Softmax Regression,ENRSR)模型,该模型基于各个基因的表达谱进行分类,并通过弹性网正则化实现稀疏约束,在进行癌症多亚型分类的同时完成了关键致病基因的选择。本文分别在仿真数据和三组基因表达谱数据(乳腺癌、小圆蓝细胞瘤和白血病)上对ENRSR模型进行仿真研究,通过k-折交叉验证和分类结果的BCubed F值得分评估模型分类性能,并和传统的分类方法,如K-means、层次聚类、非负矩阵分解、期望最大化、支持向量机和随机森林等方法进行比较。仿真结果表明,ENRSR模型在癌症多亚型分类方面能获得更理想的效果。选择出的关键致病基因通过GO通路富集度分析,在生物学功能上体现出了与相关癌症的密切联系。但该模型本身存在计算负荷过高的缺点,因此,本文进一步设计了含有两个隐藏层的全连接多层神经网络(Multi-layer Neural Networks,MLNN),以实现癌症的多亚型分类。考虑到关键致病基因的选择问题,在MLNN基本模型基础上使用ReLU激活函数。同样的,本文在ENRSR模型验证时采用的三组真实的基因表达谱数据上验证MLNN模型的性能,仿真结果表明,该模型可达到理想的分类效果。由于ReLU函数是线性激活函数,所以可通过隐藏层权值的大小简单地进行关键致病基因的选择,所选出的基因同样具备与现有参考文献相一致的生物学结论。
其他文献
近十年来,我国的经济增速在不断下降,加快产业升级和技术创新是缓解下降趋势的根本。在国民经济中占有重要地位的汽车产业,必须加大产品开发力度,才能抢占市场先机,优秀的项目管理是汽车产品开发成功的关键。汽车产品开发项目的项目管理水平的好坏是项目能够成功的重要指标之一。本文以公司A汽车产品开发项目管理为研究对象,通过分析现阶段A公司汽车产品开发项目管理中出现的问题和原因,对项目管理提出优化建议及相应的保障
鸡冠是鸡头部的皮肤衍生物,是鸡只重要的表型性状。鸡冠的大小、颜色等生理特征一定程度上与鸡的发育程度以及生产性能相关联。在单冠鸡品种中,鸡冠倒伏/直立性状普遍存在,但
当今电动汽车和大型智能电网对锂离子电池能量密度的要求愈来愈高,而传统正极材料的锂离子电池难以满足高能量密度要求。锂硫电池因具有高理论容量(1672mAh g-1)和能量密度(2
为探明miRNA在猪卵巢动态变化和发情周期中的调控作用,并筛选出一些重要的miRNA可被用于后续研究以提高母猪繁殖力,本试验采用高通量测序的方法,鉴定了约克夏母猪卵巢卵泡期(
本论文以发展幼儿的体质为前提,以幼儿篮球运动对4-5岁幼儿体质的影响为研究对象,通过文献资料法、实验法、专家访谈法、问卷调查法、数理统计法围绕着幼儿体育的总目标探索幼儿篮球运动对4-5岁幼儿体质指标的影响。本实验通过选取30名4-5岁幼儿,实验组和对照组各15人,男幼儿8人,女幼儿7人,实验前后对两组幼儿的体质指标各测试一次,其中身体形态测试项目为身高与体重;身体机能的测试项目为安静心率;身体素质
超磁致伸缩材料是一种具有应变大、能量转化率高、响应时间小、承载能力大、驱动方式简单等特点的新型功能材料,被广泛应用于航空航天、光学微处理、微位移驱动、超精密加工
研究目的探究显著影响T1期膀胱癌患者预后的因素,进一步单独分析T1亚分期患者及其相应的预后情况,以期明确尿路上皮癌T1亚分期与肿瘤预后的相关性及其是否可作为独立的显著影
目的通过分析导致前列腺癌根治术手术病理较穿刺病理评分偏高的影响因素,进而能够更准确地估算其实际病理评分和临床分期,进而为患者提供更好的诊治方案。方法我们回顾性地分
个人信用评分在商业、金融等许多领域发挥着关键作用,信用评分模型也是商业银行管理信用风险的常用工具之一。在信用消费充斥着人们生活各个方面的同时,创建一个有效的个人信用评分机制,做好信用风险管理对金融机构的盈利能力至关重要。即使用于信贷决策的信贷审批建模准确性提高很小的百分比,也会为金融机构产生重大的积极影响。本研究的目的是创建一个个人信用评分模型,信用评分模型的最终目标是将信贷申请人划分到可能清偿财
员工激励是企业人力资源管理的核心职能之一,激励策略是否科学直接关系到员工的积极性和创造力,进而关系到企业的当前绩效和可持续竞争力。而知识型员工是掌握企业核心竞争力的人,知识的创造、利用与增值、资源的合理配置,最终都要靠知识的载体——知识型员工来实现。这一点在高新技术企业中体现得尤为明显。L是一家典型的高新技术企业,近年来业务规模拓展较快,但也面临头部企业吸走优质人力资源、薪酬激励“天花板效应”等问