半监督降维和分类算法研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:easyJMS
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在很多实际应用中,随着数据采集技术和存储技术的发展,获取大量的无标号样本已变得非常容易,而获取有标号样本通常需要付出很大的代价。因而,相对于大量的无标号样本,有标号样本通常会很少。传统的无监督学习只能利用无标号样本进行学习,监督学习只利用少量的有标号样本学习,而半监督学习则能同时利用大量的无标号样本和少量的有标号样本来进行学习,因此,半监督学习是非常有意义的研究课题。半监督学习包括半监督分类、半监督回归、半监督聚类和半监督维数约减等几个方面。本文以半监督学习为基础,主要做了以下一些工作:在半监督维数约减方面,提出了一种新的算法ISSDR。一方面,它能够充分利用正负约束信息,使得在低维空间中不属于同一类的数据离的越远越好,而属于同一类的数据靠的越近越好。另一方面,引入剩余的大量未标记数据,利用隐藏在未标记数据中的潜在信息,能很好的保持数据集的全局以及局部结构。实验结果表明,该算法能从大量的未标记数据以及有限的成对约束中学习出有用的知识,实验证明了该算法的有效性。在半监督分类方面,提出了一种新的集成算法E-LNP。它选用一种基于图的半监督学习算法LNP作为子学习器,通过选择不同的特征个数以及学习参数,利用子学习器分别多次训练进行预测,然后将其预测结果按投票方式进行集成,从而得到最终的学习结果。实验表明E-LNP算法比仅使用单一的半监督分类器有更强的泛化能力,能有效的提高分类精度。
其他文献
医学影像处理是一个具有很强应用前景的研究领域,在医学诊断、临床治疗等方面起着重要的作用。其研究内容是对所采集获取的医学数据(包括CT、MRI、PET及组织切片图像)进行分
本文主要目的是要获得下面二阶共振哈密顿系统周期解的存在性和多重性结果:文中应用变分理论的一些方法和技巧,主要讨论了以下两个方面的问题:论文的第一部分考虑了此哈密顿系统
美国普利策奖评选委员会4月20日在哥伦比亚大学宣布2015年普利策奖获奖名单。南卡罗来纳州查尔斯顿市《信使邮报》的系列报道《至死不分离》获得分量最重的公共服务奖。《纽
算法的准确性和稳定性是数值代数中重要而基础的研究分支.随着科学的进步,计算机技术的发展,数值计算实际问题的规模不断扩大,产生的矩阵越来越大,那么解线性方程组就变得更加困
本学位论文主要考虑图的染色问题.图的染色理论具有重要的理论意义和实际意义,是图论研究的重要内容之一.所谓图着色是指对图中的顶点、边等元素按照一定的规则进行分类.对象
伴随人们在医院和社区门诊就诊人数的增加,易感人群增多.病原微生物种类繁多,侵入性治疗增多以及医疗设备和仪器的更新,还有一些因为抗生素的滥用和中小医院管理不善,布局不
图像融合是将多源信道采集到的关于同一目标的图像,通过互补去冗,最大限度提取各自信道中的有利信息,最终融合成高质量图像的过程,现已被广泛应用于各个领域。本文基于变换域
波兰数学家Z. Pawlak于1982年提出的粗糙集理论是一种刻画不完整性和不确定性的数学工具,它能有效分析和处理模糊、不一致和不完整等各种不完备信息,并从中发现隐含的知识,揭
生存分析一直是统计学研究的重要内容,它可以处理与剩余寿命,存活时间,失效时间有关的许多实际数据(这类数据称为寿命数据)。这些数据广泛存在于各个领域,特别是工程和生物医药领域
随着学分制的普及,部分职业中等学校也采用了学分制下的选课制。本文通过对青岛交通职业学校教育管理工作全面的调查和研究,结合该校教育管理的实际要求,分析了在Internet环