【摘 要】
:
Alpha Go和李世石的世纪大战,掀起了人工智能的第三波浪潮。各大互联网公司都开始了在人工智能领域的布局。人工智能的核心技术——机器学习,也受到了更多的关注。机器学习的
论文部分内容阅读
Alpha Go和李世石的世纪大战,掀起了人工智能的第三波浪潮。各大互联网公司都开始了在人工智能领域的布局。人工智能的核心技术——机器学习,也受到了更多的关注。机器学习的本质是从海量的资料中学习出有用的规则。机器学习的一个分支贝叶斯网络因为其在因果推理和不确定知识表达方面有良好的表现,有着广泛的实际应用。比如垃圾邮件的过滤,反作弊侦测,信用评估,医疗诊断等等。贝叶斯网络中最基础也是最简单的一个网络结构当属朴素贝叶斯模型(Naive Bayes,NB),它假设所有的属性在类变量的条件下彼此之间是相互独立的。在NB的基础上,针对属性之间是否相互关联又产生了一系列的模型:树增广朴素贝叶斯模型(Tree Augmented Naive Bayes,TAN),平均一阶依赖贝叶斯模型(Averaged One-Dependence Estimators,AODE),以及k阶依赖贝叶斯模型(k-Dependence Bayesian Networks,KDB)等等。其中NB和TAN更适用于小数据集,KDB在大数据集上表现良好但是模型复杂度也高。相对而言,AODE的分类准确度以及算法复杂度要优于其他算法,这主要得力于自身的集成学习机制。AODE本身是一个集成的一阶依赖贝叶斯模型,在它的每个子模型中所有属性都依赖于同一个属性节点即超父节点。然而每个属性轮流做超父节点的思想,放大了属性节点之间的依赖关系,而且最终的集成策略把所有子模型一致对待忽略了属性节点和类变量之间的相关性,这就导致AODE在属性关系复杂的大数据集中分类性能受到限制。为了继承AODE模型的优点,同时还能使得每个子模型内部属性的依赖关系更接近样本数据的真实分布,本文提出了AODF和WAODF两种算法。在AODE模型的基础之上,把属性之间的条件互信息作为属性依赖关系的衡量标准。首先筛选出与超父节点依赖度较弱的属性节点,按照某种原则重新为属性节点挑选父节点,每确定一个新的父节点就形成一个新的一阶依赖贝叶斯网络,从而得到了基于AODE的一阶依赖贝叶斯森林模型,简称AODF。其次结合AODF中的各个子网络结构之间的差异性,把所有子模型划分为几个类,根据类与类之间的差异和类内部的结构差异提出了基于属性节点和类变量的互信息的外部加权策略以及基于属性之间的条件互信息的内部加权策略,得到基于AODE的加权一阶依赖贝叶斯森林模型(WAODF)。为了验证所提出的算法AODF以及WAODF是有效的,本文从UCI数据集中选取了40个数据集开展了多组实验。分别从0-1 loss、macro-average两个角度来阐述算法的分类准确度以及分类稳定性。实验证明基于AODE的加权一阶依赖贝叶斯森林模型有着更高的分类精度以及分类稳定性。
其他文献
低功耗广域网作为物联网应用的重要组成部分,由于具有覆盖范围广,低成本,低功耗等特点,不仅在野外监测等方面扮演着重要的角色,在智慧城市中的多个方面也有广泛的应用,如道路照明、智能水表、智能家居、智能停车等。Lo Ra作为低功耗广域网代表性技术之一,使用免费频段传输数据且抗干扰能力强,在同类技术中优势明显且发展较为成熟,在欧美国家已有较多的商业案例。面对高速增长的物联网设备,如何高效处理Lo Ra网络
随着无线网络技术的发展,无线传感器网络逐渐被应用在各行各业中。无线传感器网络由大量的传感器节点组成,能够实时的监测环境,采集数据,并对数据进行处理、传输。它是物联网的核心,是连接着物理世界和网络空间的工具。在无线传感器网络中,认证是保障用户和节点安全的重要措施之一。由于传感器节点在存储、计算、通信方面的资源受到限制,认证协议需要在安全与效率之间保持平衡。本文对用户接入认证和分层无线传感器网络的节点
在阵列信号处理实际系统中,待处理信号可能为圆信号,也可能为非圆信号,抑或圆信号与非圆信号共存。现有工作表明,通过数据增广操作以利用信号非圆性可有效提升波束形成和信号
近年来,随着电子商务的发展,业务量呈爆炸式增长,使得各个企业的营销重心已从线下发展到线上,线下和线上融合的商业模式逐渐流行起来,这就产生了与我们生活息息相关的O2O模式。在O2O营销过程中,优惠券是一种行之有效的营销工具。识别那些更有可能使用优惠券的顾客,从而进行精准投放,进一步帮助O2O企业提高营销效率,同时,通过识别有消费倾向的顾客,增加销量。本论文主要的研究工作可以分为以下三个方面:1.数据
互联网的普及和网络支撑技术的进步,使电子商务搭上了高速发展的列车,越来越多的零售商将“新零售策略”列为企业的战略发展方向,线上渠道销售额占总销售量的百分比也在日益增加。消费者不再跟以往一样,只能通过传统的零售店购物,互联网购物逐渐成新的趋势,演变成人们生活中不可或缺的部分;此外,互联网使用场景的扩展让消费者足不出户就能够获取商品信息;同时,信息不对称性的降低使得消费者们变得更具有“策略性”。策略性
本文研究了水声通信系统中复杂的水声信道环境对传输信号的影响,主要包括传输带宽较窄使传输效率较低,多径效应和多普勒效应对传输信号造成的频率和时间双选择性衰落的影响等
本文主要通过针对阳虚大鼠电针镇痛的最佳时机在卯时;阳虚的则在酉子时的介绍,阐述了呈相互对应性,在低级中枢(腰脊髓)昼夜节律变化不明显的研究.
在当今这个以知识和科技主导的创新时代,复杂产品作为国家发展的基础型产品在促进国家经济发展、提升国际地位中起到了非常重要的作用,国家也正逐步改变产业布局,着力推动我国复杂产品产业的转型升级。面对日趋复杂的市场环境、技术环境以及政策环境,一个企业难以实现需要高资金水平、技术水平的复杂产品研发,复杂产品协同创新网络作为一种新的合作组织应运而生。而目前创新网络的失败率一直很高,其中基于协同创新项目而产生的
如今城市轨道交通飞速发展,地铁是大多数人不可或缺的交通工具。为保证列车质量可靠、运行安全,列车检查由主要人工定期巡检完成。但人工巡检安全保障模式存在以下问题:可能出现漏检或误检、检查效率低,给行车安全带来隐患。其中地铁列车转向架轴端螺栓属于关键部件,而其尺寸小,数量多,给检测带来了一定困难,因此本课题设计了一种在保证精度下的地铁列车轴端螺栓的快速检测算法。首先针对地铁列车侧面采集设备传回的图像由于
不平衡数据集中不同类别的样本之间分布不平衡,且数目相差较大,其广泛存在于网络入侵检测、癌症检测、垃圾邮件分类等各个场景中。用传统的分类器对数据进行处理时由于对少数类样本的信息学习较少,常常把少数类样本错分,造成分类效果不佳、准确率低等现象。而少数类样本中往往包含许多重要的信息,因此,研究如何提高不平衡数据的分类性能具有重要的理论和现实价值。本文从数据层面提出了基于网络节点强度的过采样算法(Node