使用机器学习方法预测不明原发灶的颈淋巴结转移癌的原发部位

来源 :南方医科大学 | 被引量 : 0次 | 上传用户:eddiew
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
不明原发灶的颈淋巴结转移癌(Metastatic cervical carcinoma from unknown primary,MCCUP)是指在经充分的检查后仍没有任何原发肿瘤的证据的发生在颈淋巴结的转移性疾病,占所有头颈部肿瘤的1-4%。鳞状细胞癌是其主要病理类型,占75%~90%。确定MCCUP的原发部位目前仍是一项挑战,尽管根据头颈部淋巴的区域引流特征,提示MCCUP可能来源头颈部(口咽、喉、舌)或胸部(气管、支气管、肺、食管)。因此,开发一种新的有效的方法来确定MCCUP中的原发部位是非常迫切的。高通量和新一代测序技术的迅速发展使我们对癌症发生发展的分子机制的认识有了更深一步的认识。有高通量研究表明鳞状细胞癌(Squamous cell carcinoma,SCC)具有一定的共同组织学特征和分子标记。这使得鉴定病理类型以鳞状细胞癌为主的MCCUP的原发灶更困难。另一项高通量实验表明食管鳞状细胞癌(Esophageal squamous cell carcinoma,ESCC)与头颈部鳞状细胞癌(Head and neck squamous cell carcinoma,HNSCC)有着很强的相似性,而此两种鳞状细胞癌均为MCCUP的两个重要潜在的原发部位。因此在本研究中,我们通过研究一种新的方法来鉴别这两种鳞状细胞癌来辅助MCCUP的原发灶的诊断。我们从公共数据库下载了食管鳞状细胞癌和头颈部鳞状细胞癌的基因芯片数据集,使用R语言导入这些芯片数据并进行预处理后得到表达谱矩阵,行差异分析得到各个芯片的差异基因,再分别对食管鳞状细胞癌和头颈部鳞状细胞的芯片取交集作为这两种癌症各自的差异基因,然后对这两种鳞状细胞癌的差异基因进行集合运算得到它们的交集和差集(差集代表了这两种鳞状细胞癌的各自特有的差异基因,交集代表了它们的共同差异基因)。我们分别对这两种鳞状细胞癌的共同和各自特有的基因进行了 GO、KEGG通路和蛋白-蛋白相互作用网络(PPI)等分析,最后我们基于HNSCC与ESCC的各自特有差异基因,我们使用随机选择的方法提取特征进行特征选择,分别使用K近邻、随机森林、支持向量机等算法训练模型来预测和判断肿瘤组织类型。我们发现了这两种鳞状细胞癌的共同和各自特有的基因在GO、KEGG通路富集到功能和通路具有很多相同也有一些不同,蛋白-蛋白相互作用网络(PPI)分析亦是如此。基于三种机器学习算法建立的模型,我们使用一个独立的数据集进行验证发现由5个基因组成的支持向量机模型的准确率最高。通过本研究我们探索了食管鳞状细胞癌和头颈部鳞状细胞癌的差异基因不论是在相似度上,还是在所富集的GO功能、KEGG通路和PPI网络上都有诸多相似性同时也存在一些差异。由5个基因组成的支持向量机模型能有效的区分两种鳞状细胞癌,这可能有助于MCCUP患者的精确诊断。
其他文献
认认真真原原本本结合实际深入学习$$ 习近平总书记的重要讲话是加强党的建设、加强宣传思想工作的纲领性文件,回答了党和国家建设的很多现实问题,具有高度的战略意义和现实
报纸
共轭亚油酸(conjugated linoleicacid,CLA)是具有共轭双键的十八碳脂肪酸的总称,有许多生理功效,在医疗和保健方面有很大的应用价值。CLA是亚油酸异构酶催化生成的,受转录因子的调
目的:分析冠状动脉药物洗脱支架植入术后再狭窄(Drug eluting stents-in stent restenosis,DES-ISR)的影响因素,以期为DES-ISR的预防及治疗提供理论依据,为指导今后经济、安
随着本体知识库的不断发布与本体构建工具的日益成熟,复用技术越来越为本体构建方法学所推崇。由于不同地区的地理环境、语言和文化的不同,对同一个事物的表达也不同,运用本
以海鲜菇为原料,采用热水浸提法提取海鲜菇多糖(Polysaccharides from hypsizygus marmoreus, HMP),采用乙酸酐法制备乙酰化海鲜菇多糖(Acetylated polysaccharides from hyp
目的针对飞行器环境适应性设计不足的现状提出对策。方法分析飞行器环境适应性设计的特点和当前存在的不足,以某电气设备为对象开展应用研究。结果提出环境适应性设计工作内
科学发展观是发展中国特色社会主义必须坚持和贯彻的重大战略思想.是我国经济社会发展的重要指导方针。在经济社会发展的今天.必须深入贯彻落实科学发展观。那么.在经济方面.如何
<正>10月18日,由中国互联网金融协会金融科技发展与研究专委会、新华社瞭望智库联合撰写的《中国商业银行数字化转型调查研究报告》正式发布。报告显示,从总体上看,我国商业
目的:1、通过血流储备分数(Fracional Flow Rreserve,FFR)的测量,了解冠状动脉慢性完全闭塞性病变(Chronic Total Occlusion,CTO)远端心肌缺血情况以及侧支循环功能;2、比较主要供体血管血流储备分数(Fracional Flow Rreserve of the predominant donor vessel,FFRdon)在CTO经皮冠状动脉介入治
针对实验目的不同,选择合适的雾霾吸入肺损伤动物模型对临床上雾霾吸入性肺损伤疾病的发生机理、防治及药物的研究选择都有重要的意义。依据国内外参考文献将雾霾吸入性肺损