【摘 要】
:
分类是数据挖掘领域的一项重要任务,由于其广泛应用而得到人们的普遍关注,当前的分类模型,根据其建模机制的不同可以分为两大类,产生式分类模型和判别式分类模型。产生式分类
论文部分内容阅读
分类是数据挖掘领域的一项重要任务,由于其广泛应用而得到人们的普遍关注,当前的分类模型,根据其建模机制的不同可以分为两大类,产生式分类模型和判别式分类模型。产生式分类模型主要对类内的分布建模,判别式主要对类与类之间的分布建模。本文从分类准确率、建模时间和渐进效率等方面对产生式和判别式的分类性能进行了比较研究,通过实验得出结论:产生式分类方法受数据分布的影响较大,但建模时间短,速度快,适用于小型的数据集。判别式分类方法分类准确率较高,但建模时间长,速度慢。该结论与Ng等人的实验结论一致。基于产生式和判别式互补的性质,构造产生式和判别式的混合模型已成为当前的研究热点。基于混合模型的工作主要集中在监督学习和半监督学习领域,其中混合分类模型的研究主要集中在两个领域,一个是产生式和判别式之间的内在关系,另一个就是混合模型的构建。当前混合模型的构建主要有三种方法,即基于属性或数据分割的混合分类模型、产生式和判别式的模块化组合、产生式和判别式的互相学习。目前这些混合分类模型已取得较好的分类性能。基于产生式分类模型受数据分布影响较大的性质,本文提出一种新的基于属性分割的混合分类模型。通过对样本属性的测试,将属性集合分为两个子集,分别在两个子集上建立产生式和判别式分类模型,最后将两者合并。并将该模型应用到邮件分类中,实验证明该方法较好地拟合了产生式和判别式的分类方法,有效提高分类性能。
其他文献
演化算法是一种模拟生物演化过程与机制求解优化问题的一类自组织、自适应人工智能技术。协同演化算法是在演化算法的基础上发展起来的一种新的演化机制,它基于生物学协同进
随着网络技术的日益发展,网络安全机制的研究越来越被重视。随着入侵检测技术的研究越来越广泛,未知网络攻击的异常检测技术并没有得到广泛研究。由于Web应用技术的迅速发展,
基于数据仓库技术的决策支持系统在电信、银行、金融、医疗和商业零售领域应用广泛,为企业发展提供了强有力的信息保障。图书馆作为公共服务机构,如何利用新技术为读者提供更
Petri网理论是研究离散事件动态系统(DEDS)的一种有力工具,动态模糊Petri网(DFPN)作为其重要分支,由苏州大学李凡长教授首次提出,能够准确描述系统的状态及其变化过程,有助于
信号与图像处理的应用中,正交变换的本质是把待处理的信号(或图像)用一组正交基表示,然后在“频率”域中对变换系数进行分析与处理,由于正交变换去相关能力强,变换系数的信息
随着信息和网络技术的发展,人们提出了随时随地访问信息的要求,移动计算作为分布式计算技术和无线通讯技术结合的产物应运而生。移动计算网络具有带宽窄、通讯易受干扰、结点
随着大规模信息的涌现,目前界面中的各种显示方式已很难把它们完整而连续地显示在计算机屏幕上,这给人们带来了许多新的认知困难。近年来,人们在信息可视化领域对信息的显示
随着计算机技术在不同行业中的广泛应用,大量业务数据随之产生,这些数据超出传统持久关系的数据模型,以瞬时数据流的形式存在。人们希望利用这类数据的特点对其进行分析,挖掘
随着网络技术的迅速发展和网络基础设施的不断完善,分布式系统已经成为信息处理学科的重要领域,如何协调分布式系统的各个组成服务已经成为热点。BTP协议是一套与协议无关,为
MPLS技术在流量工程、VPN、QoS等方面表现出了其他技术不可比拟的优越性,已经成为国内外研究的热点。本文首先对MPLS网络中分组转发与处理过程进行了介绍,描述了MPLS网络在工