标记分布学习若干问题研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:Oom
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
如何解决标记多义性问题是机器学习领域的热门研究方向。目前机器学习研究领域应对标记多义性比较成熟的学习范式是多标记学习。多标记学习是对单标记学习的拓展,即允许同一个示例与多个标记关联。因此,相较单标记学习更适用于许多具有标记多义性的问题。但是,仍存在一些问题是不适合直接使用多标记学习解决的。因此,为了更好和更直接地解决这类标记多义性问题,标记分布学习被提了出来。标记分布学习是对多标记学习的进一步拓展。理论上,标记分布学习具有更多的适用场景。因此,深入研究标记分布学习技术,将有可能使更多的标记多义性问题得到更好地解决。基于这个研究目的,本文将按以下顺序对标记分布学习中的若干问题展开研究。1.同多标记学习一样,不能只使用单一的一种指标来评价一个标记分布学习算法的预测效果,需要制定一组评价指标从不同方面进行综合评价。因此,本文根据不同分布间的距离/相似度的语法和语义关系按照一定的策略选取了一组具有多样性和代表性的评价指标。从理论和实验结果上看这组指标能从不同方面正确而综合地反映一个算法的预测效果。2. 目前,用来设计标记分布学习算法的常用策略有三种。它们是问题转换策略、算法改造策略和专门化算法策略。基于这三种策略设计出的算法,其预测效果上可能存在一定的差异。分析这些差异将有助于推动标记分布学习算法设计的发展。因此,本文在大量标记分布数据集上对三种策略展开了对比研究。实验结果和理论分析表明,基于专门化算法的设计策略是一种更为有效的设计策略。3.接着,本文对这种策略展开研究。希望能够完善这种算法设计策略。本文分析了这一算法设计策略的特点,总结出了一种专门化算法设计框架。然后对这个框架中的目标函数部分进行研究,并通过实验结果和理论分析,提出了一些目标函数选取的建议。
其他文献
随着电子信息技术的发展,新的信息以一种前所未有的速率在产生和处理,同时网络也大大加快了信息传播的速度,这使得对海量信息的处理成为了人们的一种迫切需求。仅仅使用本地
智能视频监控自诞生以来就一直是机器视觉领域的研究难点与热点。智能视频监控研究的内容包括运动目标检测、目标分类、目标跟踪、行为分析以及异常个体跟踪。目前关于这几个
属性约简是粗糙集理论中的重要研究内容之一,传统的静态属性约简算法只能处理静态的数据集,然而现实世界中的数据是动态变化的,因此增量式属性约简方法的研究具有重要的理论
僵尸网络是指控制者出于恶意目的使用僵尸程序感染大量网络主机并对其进行控制从而形成的一种攻击网络,它主要通过命令与控制(C&C)信道进行通信。僵尸网络可以用来执行分布式
目前嵌入式领域软件开发方法不利于嵌入式系统的发展,如何将高级的构件技术应用到嵌入式系统软件开发中,以便快速灵活高效地设计系统,已成为其发展的关键。传统的构件描述与检索
无线Mesh网络作为一种解决无线接入“最后一公里”问题的关键技术受到了越来越广泛的关注。为具有不同QoS需求的多种业务提供服务质量保障是基于IEEE802.16无线Mesh网络的基
近年来随着市场竞争的加剧和客户需求的个性化,现代企业生产模式正在朝着“品种多样、批量变小、注重交期、减少库存”的方向发展。车间作业调度是解决现代企业生产过程中工
近年来,随着一些实际应用领域中大规模稀疏矩阵求解问题的推动,代数多重网格AMG(Algebraic Multigrid Algorithm)算法及其并行化的研究成为了数值计算领域的热点。   本文在
学位
随着社会信息化进程的飞速发展,信息技术已广泛应用于社会生活的各个领域,在更好地为人类提供服务的同时,也带来了一个极为严峻的信息安全问题。信息安全不仅关系到个人的切
在面向服务的体系架构中,Web服务是一种典型的技术手段,单个Web服务由于功能有限已不能满足用户复杂的应用请求,因此催生了通过组合现有Wcb服务来构建满足用户复杂需求的增值