【摘 要】
:
癌症,也称为恶性肿瘤,是当今严重影响人类健康、威胁人类生存的主要疾病之一,由于癌症具有较强的转移、浸润以及无限增长等特性,使得传统治疗方法很难达到治愈肿瘤的可能。目
论文部分内容阅读
癌症,也称为恶性肿瘤,是当今严重影响人类健康、威胁人类生存的主要疾病之一,由于癌症具有较强的转移、浸润以及无限增长等特性,使得传统治疗方法很难达到治愈肿瘤的可能。目前已证实,肿瘤的发生、发展是一个多基因参与、多步骤、多阶段的过程,随着人类对癌症的不断探究以及近现代科技水平的提高,特别是进入了后基因组时代,基因芯片(genechip)的问世为癌症的治疗带来了新的希望。本文对基因芯片的数据分析,做了两方面的工作。目前在用基因芯片数据筛选差异表达基因的多重比较中,广泛使用错误发现率(false discovery rate,FDR)方法,并用 ALSU(Adaptive linear step-up)控制程序进行计算。在FDR方法的应用中,非差异表达基因个数m0的估计对筛选差异表达基因至关重要。本文对针对现有m0估计方法(ABH法、S-λ法以及TST方法)的不足,提出了几种新的估计方法(小范围内迭代法,小范围内拟合法以及大范围内拟合法),应用计算机模拟基因芯片数据,使用均值、标准差、极差、四分位数间距、均方根误差以及变异系数作为评价指标,对传统方法和新方法的估计结果进行比较和评估,结果显示新方法较原方法更准确、更稳定。在用FDR方法筛选癌症相关的基因表达谱数据的研究中还发现了这样的问题:同一种癌症的不同基因表达谱数据中发现的差异表达基因仅有少部分是重叠的,即重复率低。是FDR方法不稳定还是数据误差导致该现象的出现?本文对此进行了深入研究。本文用GEO数据库中前列腺癌症数据(系列号GSE6919)作为研究对象,利用计算机产生不同误差的模拟数据,用FDR筛选差异表达基因,计算重复率,探讨误差对重复率的影响,得到了两者之间的定量关系。结果表明,当误差限小于30%时,误差与重复率呈线性关系。在检验水平为0.05时,当扰动误差限增加一个百分点时,差异基因总体重复率减少2.5%,PATHWAY总体重复率下降0.76%,PATHWAY基因重复率下降0.23%。如果相对误差被控制在10%以内,则差异基因总体重复率将不低于75%。因此,我们的研究结果说明,较小的误差不会引起重复率较大的变化,FDR算法是稳定的,是筛选差异表达基因的较好的统计方法。所以,重复率低的主要原因,是数据扰动的误差引起的。基因芯片数据的扰动误差来源于实验误差和生物学误差,随着科学技术水平的不断进步,仪器设备质量提高、实验手段、方法的完善,实验测量误差会得到更好的控制。而基因表达的生物学差异,将是影响基因表达水平的主要因素,如果差异基因总体重复率较低,则要更多考虑控制生物学误差。
其他文献
隧道火灾给隧道的长期安全运营、防灾救援带来了极大挑战。同时,隧道火灾的发展过程及规律与隧道的几何尺寸密切相关。水下大断面隧道呈超宽扁平状,地质情况特殊及周边路网复杂,一旦发生火灾,人员疏散及救援困难,造成后果尤为严重。此外,长大隧道通常建立庞大复杂的通风排烟系统,其智能化及信息化水平亟需提升。目前关于长大水下隧道的相关规范标准较少,隧道安全运营体系研究正逐步开展。因此,论文开展了水下大断面隧道火灾
人口问题始终是人类社会共同面对的基础性、全局性和战略性问题,《国家人口发展规划(2016-2030年)》提出“促进人口长期均衡发展”的要求,人口的均衡发展对于我国经济社会的发展具有重要意义。作为我国五个自治区之一的广西壮族自治区,不仅存在我国普遍面临的人口问题,同时还存在一些广西区内特有的问题。分析研究广西人口发展现状及人口均衡发展存在的主要问题,对于革除发展阻碍,改善人口现状,从而促进广西乃至全
现在模具广泛应用于产品加工,从小的塑料玩具到大型的机械设备、航天器,都有模具加工的身影。据统计,使用模具生产在整个工业产品的中已经达到60%-90%,俨然成为工业发展的基
绝对值方程组(AVE)Ax+B|x|-b,A,B∈Cn×nx,b∈Cn是一类比较特殊的非线性问题,也是NP-hard问题.该问题广泛出现在计算数学、运筹学、经济学等学科和工程中,具体来源于线性互补问
气候变化与人类生活密切相关,近几十年来,气候变化对人类生活产生了越来越多的负面影响,引起国内外学者的广泛重视。为了更好地了解未来气候变化,需要深刻理解过去气候环境变化的规律特征。树木年轮具有分布广泛、连续性强、样本易得、分辨率高等特点,已成为研究古气候古环境变化的核心代用指标之一。本文的研究区位于山西省北部,属于吕梁山脉。气候特征为半干旱大陆性季风气候,四季分明。吕梁山位于我国400mm降水等值线
非相干数字全息是一种非扫描的三维成像技术。该技术的照明光源是空间非相干光,所以从物体的任意两点发出的光不具有空间互相干性,但同一物点发出的光在经过衍射分光后得到的两束光是空间自相干的。利用同一物点发出的光分束后自干涉可得到该物点的全息图这一特性,整个物体的全息图可由所有的物点的全息图非相干叠加得到。通过适当的数值算法可以实现全息图的重建,再现原始物体的三维的像。由于非相干全息术可以实现空间非相干光
金属卡宾由于其丰富的反应特性而受到合成化学家们广泛的关注。近年来,基于烯炔酮在过渡金属催化下而产生的金属卡宾越来越受到人们的重视。相比于重氮化合物作为金属卡宾的
论文依托于“南羌塘中生代盆地区域地质专项调查”项目,研究区位于西藏羌塘盆地中部龙木错-双湖缝合带内部,地理位置为西藏自治区阿里地区改则县以北冈玛错附近。龙木错-双湖
电力行业是推动我国经济发展的重要能源行业,从最初的化石燃料(石油、煤炭、天然气)发电到现在的新能源(核能、风能、水能)发电,电力行业正在逐渐向新的邻域寻求可再生资源。同时,随着网络信息的普及,大量的网络信息存在与电力公司和用户之间。其中,一些不法分子通过网络攻击对许多公司造成了无法挽回的损失。大数据的到来使得信息数据呈现爆炸式的增长,普通的日志收集和处理已经无法满足人们的需求。许多公司开发出了优秀
随着生命科学研究的不断深入,对各种生命现象发生的机制,特别是对细胞内蛋白质-蛋白质间的相互作用的研究变得尤为重要。在过去十几年来,由于蛋白质组学得到迅速发展,蛋白质