距离度量学习的理论与算法研究:核回归、大间隔最近邻与Fisher线性判别

被引量 : 0次 | 上传用户:db0928
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
距离度量学习已经在回归,聚类和分类等任务上发挥了重要的作用。本文分别在核回归、大间隔最近邻分类和Fisher线性判别分类上进行距离度量的理论与算法研究。传统的核回归使用的是欧式距离,该距离将所有特征间的差别平等对待,不能很好的揭示内部结构。与欧式距离不同,马氏距离将特征间的差别分别对待,并且不受样本量纲大小的影响,可以很好的揭示内部结构。我们将马氏距离与传统的核回归相结合的模型应用于短时的交通流量预测,并使用梯度下降法进行参数估计。通过在实际交通流量数据上的实验,证明了该方法的有效性。最近提出的大间隔最近邻分类方法大幅度提高了K近邻分类的性能。但现实世界中的数据往往都呈现局部性,而大间隔最近邻分类所获得的却是一个全局度量。因此我们提出了一种新的局部度量方法——逐级度量学习的方法来进一步改进大间隔最近邻分类的性能。通过多组人工数据集和实际数据集的实验,证明了改进算法的高效性。距离度量学习的目标之一是使同类的样本之间的距离尽量缩小,不同类样本之间的距离尽量的扩大。Fisher线性判别的思想与距离度量的学习目标十分一致。在现实世界中,大多数物体都拥有多个属性,而这些属性往往又可以被分成多个组。传统的Fisher线性判别将所有的属性都归到一起进行学习。我们将多视角学习与Fisher线性判别相结合,提出了一种新的多视角Fisher线性判别。此外,传统的Fisher线性判别多类类间散度是通过每类的均值和总均值之间的差值计算的,该算法没有考虑样本分布的局部性。为了使我们提出的多视角Fisher线性判别更好得适用于多类数据集,因此我们进而将该方法与逐级度量学习相结合,提出了基于逐级度量学习的多视角Fisher线性判别。最后,通过多组人工数据集的和实际数据集的实验,证明了该算法的有效性。
其他文献
金融是现代经济的核心。要实现经济的可持续发展,金融系统的稳健运行是至关重要的。而要达到这一目标,不仅需要市场机制的自我调节和自我稳定,而且需要政府进行灵活有效调节
通过对藏族农村社区婚礼仪式变迁的实地研究和文献研究,笔者认为国家与社会关系的变化影响着藏族农村社区婚礼仪式的变迁。国家与社会的关系在不同历史时期对藏族农村社区婚
[目的]观察补髓生血解毒汤降低化疗诱导急性早幼粒细胞白血病毒副反应疗效。[方法]使用前瞻性设计临床观察方法,对5例住院初治急性早幼粒细胞白血病实施全反式维甲酸联合三氧
高中阶段是学生成长的关键时期,对学生未来的人生走向有着重要影响。语文教材选篇很可能会对学生的人生观世界观以及各种能力的形成产生影响。本文所探讨的的核心问题正是高
自2008年以来,随着水平井和水力压裂技术的进步,美国页岩气产量呈现爆发式增长,2013年约占美国天然气总产量的40%。页岩气产量的大幅增长拉低了美国的天然气价格,惠及该国能
1999年,我国的内部审计准则开始制定,而在2009年,国际内部审计协会重新颁布了内部审计实务准则。我国的内部审计准则与新颁布的国际内部审计准则存在着较大差异。本文立足于
词汇在写作中起重要作用。近年来,词汇研究领域的趋势之一是在第二语言词汇知识方面的理论探讨和实证研究。在词汇和写作技能关系的研究中,从词汇的质(词汇知识的深度)方面的研
在牡丹江市城区淤泥质土分布地段进行工程建设 ,必须加强工程地质勘察工作 ,查清淤泥质土的分布及物理力学特性 ,为建设工程的设计、施工提供可靠的依据 ,以采取科学、合理、
2000年至2008年在普京作为总统主政俄罗斯期间,经过中俄双方的共同努力,中俄战略协作伙伴关系达到前所未有的高水平。中俄关系几乎每年都要跨上一个新台阶,成为世界大国关系
随着国民经济的快速发展,电能质量问题已经引起人们的广泛关注,谐波问题作为电能质量的一个重要分支正受到越来越大的重视,而谐波检测是谐波问题研究的主要依据。本文介绍了