几类监督学习算法在随机生物模型参数估计中的应用

来源 :天津工业大学 | 被引量 : 0次 | 上传用户:kevinsnower
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
关于随机生物模型的参数估计问题一直以来都备受关注,但大多数研究都是借助数学知识来解决该问题的,如:动力学行为、随机微分方程等。而随着计算机科学的发展,机器学习理论逐渐丰富,又由于生物模型的参数估计涉及到数据的分析,这让机器学习算法在关于生物模型的参数估计问题中大放异彩,发挥着其独特的作用。本文主要详细介绍了几种监督学习的算法,并以具体的生物问题为背景,分别利用这几类算法对相关的随机生物模型进行了参数估计。第三章首先简单介绍了EM算法的原理和步骤,根据某些实际情况下E步中积分无法计算的缺点,接着引出了Monte Carlo EM(MCEM)算法,MCEM算法通过Monte Carlo模拟的方法估计出了E步中的积分,弥补了EM算法的缺陷,并提高了实用性。此外,本章还对MCEM算法在Logit-Normal模型中参数估计的应用进行了研究,首先根据MH抽样得到模拟数据,接着根据模拟数据近似求得了积分,最后通过反复迭代估计出了参数值。第四章详细描述了以MCMC算法为基础的MCWM算法和GIMH算法,它们都是数据缺失情况下参数估计的方法,这两个算法通过联合抽样的方式得到边缘分布的样本,所得样本均可被看作来自于近似的目标后验分布,可用于参数估计。本章还结合随机传染病模型对模型中的感染率和恢复率进行了估计,首先通过Gillespie算法模拟出真实的传染病发展过程,将不完备数据的参数估计问题转化为完备数据的参数估计,然后对两个算法的准确性进行了验证。最后,还将其运用于英国寄宿学校流感爆发的实例中,进一步证明了算法的有效性。第五章研究了RNA干扰中si RNA逃逸量估计的问题。从内涵体中逃逸出的si RNA的量对RNA干扰的效率有着重大影响,而通常通过检测生物体及其组织,并不能测量出从内涵体逃逸到细胞质中并真正参与RNAi反应的si RNA的量。在受到瓶颈问题的启发后,我们将贝叶斯推断分别用于估计单类型和多类型的si RNA的逃逸量,并结合Gillespie算法和近邻法给出了相应的算法。但在实践中发现:由于计算精确后验分布的复杂度较高,导致算法运行效率低下,于是又对MCMC方法进行了改进,并将其运用于同样的问题。还分别以关于干扰蝗虫几丁质合成的基因和多靶点肿瘤基因治疗为例,利用两个方法准确估计出si RNA的逃逸量,结果表明改进的MCMC方法具有更高的运行效率。
其他文献
β-兴奋剂(β-adrenergic agonist)是苯乙醇胺的一类衍生物。对动物体具有促进肌肉组织生长,影响脂肪含量,能提高动物组织的瘦肉率和增加瘦肉的产量。高残留的β-兴奋剂,会产生
可见光半导体光催化技术不仅具有反应条件温和、无毒无害、环境友好等优点而且可以直接利用太阳光作为能源,因此被认为是一种新型的绿色催化技术。可见光半导体光催化技术广
素质教育的相关行业在近几年得到了飞速发展,相关学术论坛发声频繁、交流会议也日益增加。2018年3月30日至31日,第七届全国素质教育论坛在成都举行,笔者担任活动口译志愿者,承担了部分交替传译、陪同翻译任务。在此次活动中,笔者承担的口译工作涉及汉英、英汉实践,因此本报告将从双向维度进行探索。完成这次任务后,笔者尝试从自身翻译实践出发,以吉尔精力分配模型为切入口,系统地剖析了自身表现,探索了翻译活动中
生物大分子液液分离相变(相变)是由于生物大分子的多价相互作用而导致大分子与周围溶液分离的现象。相变过程中,发生相分离的生物大分子会在周围液态体系中形成一种液滴状结
压裂技术是油气井增产、注水井增注重要方法,但压裂返排液中含大量难降解高分子聚合物和污染物,若不及时处理而进入生态循环,会破坏井场周围生态环境、影响周边地表水系统状
近年来,带有声边界条件的方程成为很多前辈关注的焦点.在前人的基础上,我们这篇文章主要研究的是带有记忆项,强阻尼和声边界条件的非线性粘弹性Kirchhoff型方程(?)这里的Ω是
矿区大规模的重型机械压实造成了严重的土壤退化,压实导致土壤内部孔隙排列重组,限制土壤水和养分的运移,容易造成水土流失、生态恶化等严重后果,对矿区的土地复垦工作带来很大难度。探讨水力特性在不同容重下的变化特征,对矿区复垦土壤恢复和保持土壤水文平衡具有重要意义。目前,矿区压实土壤的水力特性研究总体上不够深入,缺乏理论基础。本研究中,土壤样品采自中国平朔矿区安太堡露天煤矿排土场,在实验室制备了不同容重(
自动语音识别技术是可以使人与机器交流更加顺畅的关键技术之一。近年来随着深度学习技术的不断发展,语音识别的准确率得到了很大程度的提升。通过研究发现,充足且有效的训练数据可以使语音识别效果有很大的提升。例如英语和汉语普通话这样的数据资源充足的语言,语音识别的准确性已经达到了人的水平,但是很多语言的数据资源相对有限,这就导致这类语言在语音识别的研究上没有取得很好的进展。本文在藏语语音识别中对训练数据获取
近年来,柔性显示、柔性太阳能电池、电子皮肤等新型电子器件的出现,对透明导电材料提出了新的要求——不仅要具备良好的光电性能,还要具有可拉伸和可弯折特性。传统金属氧化
芳基硫醚化合物在精细化工、稀有金属和贵金属的萃取分离中具有广泛用途,同时在农药、医药中间体和材料合成等诸多领域中也非常重要,因此构建C-S键具有非常重要的研究意义。