数据流中漂移的检测与分类方法研究

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:chppxhn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着5G通信时代的到来,人工智能、云计算和物联网等相关行业的不断壮大,越来越多的数据以流的形式增长。由于数据随时间不断涌现,因此难免出现结构分布改变的现象,即概念漂移。已有模型的预测性能会因数据流中存在的漂移而大大降低。因此,对数据流中漂移的检测和分类算法的研究具有重要意义。在漂移检测方面,大部分研究是在样本标签完整的前提下开展的,但由于数据标记成本大以及难以实现全部标记等现实因素的存在,限制了有监督的漂移检测方法。为减少对样本标签的需求,本文针对半监督学习,提出了一种模糊边缘密度漂移检测方案。在适应漂移阶段,现有的自适应模型主要关注漂移发生后的模型更新,本文将更多的焦点放在初始训练集,充分挖掘其中的有效信息。本文的主要贡献如下:1.提出了基于模糊边缘密度的漂移检测算法。由于边缘数据集并没有明确清晰的界限,因此我们利用模糊集的理论,将边缘数据集的边界“软化”,根据边缘数据集的隶属函数对每个样本加权,计算模糊边缘密度。这种方法更加准确的描述和量化了分类模型对数据流中样本的预测置信度,充分利用了边缘间隔内数据的分布情况。我们通过在合成数据集上进行实验,分析了该算法在漂移检测中的表现性能。实验表明加入模糊集的漂移检测模型有效地减少了误报率。2.提出了一种结合特征选择子空间和boosting提升学习的漂移自适应集成方法,将模型训练的工作重心放在初始训练集上。从特征属性和误分类样本两个角度充分挖掘初始训练集中的有效信息,从而提高了模型的预测准确度,同时可以灵活应对后续的漂移自适应。实验证明我们的算法在准确度方面取得了较好的表现,且具有一定的稳定性。
其他文献
学习动机研究是二语习得中的重要研究领域,先后经历了四个发展阶段:社会心理模式、认知情景模式、过程取向模式和社会动态模式。21世纪以来,非线性系统动力学的引入为学习动机提供了新的研究视角。定向动机流作为该领域的最新成果,将特定的学习目标与个人动机行为联系起来,重点考察如何激发并维持高强度的学习动机。将这一前沿的动机理论合理运用到高中教育阶段,不仅进一步拓展动机理论的研究视角,还能指导一线教师的课堂教
改革开放以来,我国的经济以及综合国力的发展取得了举世瞩目的成就,人口老龄化趋势也随之而至,国际上对于老龄化的公认标准是该国家或地区60岁以上的人口占总人口比例达到10%以上或65岁以上人口占总人口比例的7%以上称之为达到老龄化标准。根据官方数据统计,我国65岁及以上人口在2018年达到16658万,占据我国总人口的11.9%,远远超过7%标准。人口老龄化必将带来医疗保险基金收支的平衡问题,很多国家
随着人工智能的飞速发展,生物识别技术不断成熟,应用场景越来越多元和丰富。虹膜识别是目前普遍使用的一种安全可靠的生物识别技术。然而,在各种应用场景中,由于设备和环境的限制导致采集到的虹膜图像往往难以达到用于识别的最理想的图像质量。本文针对这一问题和实际需求,基于对现有图像增强方法和虹膜识别技术的研究,结合实际的虹膜识别流程和设备,提出了一种全新的有效的虹膜图像增强系统设计方案。首先,为了正确对虹膜图
直流电弧等离子体法作为一种制备高纯度石墨烯的有效方法,具有操作安全简易、环境友好和制备效率高等优点,且可以通过改变实验条件对石墨烯的尺寸与层数进行控制。但石墨烯的生长机理不同于碳纳米管,其制备过程无需催化剂,无法从催化剂成核的角度来解释其生长机理。另一方面,电弧等离子体具有高温特性和复杂的电磁相互作用,导致关于等离子体性质的研究难度较大,这也是电弧法制备石墨烯的生长机理尚未得到定论的原因。针对以上
在自然语言处理领域,古诗自动生成的研究成为了一项富有挑战性的工作,吸引着许多的专家学者加入到研究队列中。古诗自动生成的研究是对中国传统文学文化的一种推广和传播,同时对中文自然语言处理的发展也极具意义。本文主要基于对抗训练和强化学习的思想,对关键词生成古诗和图像生成古诗进行研究,主要工作如下:一、提出一种基于多对抗训练的序列生成古诗的方法。设计了具有双编码器的序列到序列生成模型,通过注意力机制对关键
移动通信技术的发展让人们对卫星通信提出了更高的需求。构建具有广覆盖、高传输速率的星地融合网络势在必行,地面5G移动通信系统与低轨(Low Earth Orbit,LEO)卫星移动通信系统的融合在其中扮演着重要的角色。正交频分复用(Orthogonal Frequency Division Multiplexing,OFDM)技术以其频谱利用率高、资源分配方式灵活、便于与其他技术融合以及与地面移动通
资金如同企业的血液,企业的生产发展离不开资金的支持。信息不对称、代理问题的存在导致外部融资成本往往高于内部融资成本,从而对企业资金使用造成限制,形成融资约束。企业
随着环境问题的日益严重,人与自然的关系成为人类社会当前面临的最为重要的议题之一。单一主体的绿色行动对环境治理问题的作用有限,绿色治理作为一种新的治理观被提出。绿色治理强调多元治理主体的协同作用,而企业是绿色治理最为关键的行动者。钢铁工业是中国国民经济最为重要的基础产业之一,同时也是高污染、高能耗的行业。近年来,在国家大力推进生态文明建设的大背景下,钢铁企业的能耗比重有所降低,污染物排放量也得到控制
大学生是新时代青年的代表,在思想方面,必须坚定理想信念,做讲政治的新青年。在思想政治教育学习中,大学生切实有所得、有所感,有助于大学生构建正确的认知结构。本文详细阐述了思想政治教育获得感内涵、大学生思想政治教育获得感现状及如何提升大学生思想政治教育获得感。并以马克思主义人学理论和心理学学习理论为理论基础,根据心理学学习理论中的认知主义、人本主义和行为主义分析出思想政治教育获得感的基本构成。以认知、
机械装配质量直接影响机电产品的整体质量,其检测是复杂机电产品制造质量保证的重要组成部分。现代机械制造正朝着轻量、高速、高效、高精度、智能化的方向发展,这对装配质量检测提出了更高的要求。如何建立一套功能全面且操作简便的检测指标与规范方法,是机械装配质量检测领域的重要问题。目前,常规的机械装配质量检测主要集中在诸如公差与尺寸协调性等的“静态质量”指标,尚缺乏装配“动态质量”的关注和研究,这不利于产品整