基于AUC的SVM多类分类算法的优化

来源 :武汉科技大学 | 被引量 : 0次 | 上传用户:d2587754
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
支持向量机(Support Vector Machine, SVM)算法作为分类学习领域中一个分类正确率(Accuracy)较高的算法已经得到了广泛的应用,但其对于多类别代价敏感性数据的分类方法仍然没有一个统一的模式,并且以正确率作为评价标准并不能保证总体误分类代价最小。AUC (Area Under the ROC Curve, ROC曲线下面积)评价标准可以衡量数据类别在任何分布或任何错误代价下分类算法的总体性能并且已经广泛应用于机器学习中对多类分类算法进行评价。针对此现状,本文在详细分析AUC评价标准和SVM多类分类方法后,通过两者的结合来对多类别数据进行分类,并利用遗传算法(Genetic Algorithm, GA)对其分类结果AUC进行优化,从而形成了一个新的SVM多类分类方法——基于AUC的遗传算法优化SVM多类分类方法(GA Optimize Multi-class SVM Based on AUC, GOSMAUC)。GOSMAUC既解决了AUC评价SVM多类分类结果的问题,又能够对其结果进行优化,该方法对于SVM在多类分类学习领域提供了一个更为有效的解决多类分类问题的方法。本文在LIBSVM平台上通过改造实现了GOSMAUC算法并在UCI多类别数据集上进行了实验验证。其结果表明GOSMAUC可以有效的评价SVM多类分类方法的分类性能,并且相对其它相关算法在AUC评价结果上有了较大的提高。该方法具有计算复杂度低、可理解性强、与多类别数据分布无关等优点,可以用来解决多类别分类问题。
其他文献
传统的信息管理系统都是采用“硬编码”方式将具体业务流程的处理写在系统中的,一旦企业或组织内部流程发生变更,往往需要对原有的系统进行改动。这些改动所带来的工作量往往是
本文针对城市交通道路网的特点,对GIS(地理信息系统)环境下多因素约束的时间窗车辆最优路径选择问题的关键技术进行了研究。旨在通过动态路径寻优系统规划出到达目的地的最优
有效的软件过程管理是解决软件危机的行之有效的办法,而软件项目的跟踪与监控(SPTO)对提高软件过程的管理是非常重要和关键的。CMM/CMMI等软件过程模型被广泛用于指导软件过程
入侵检测是近年来网络安全研究的热点,随着计算机安全问题的日益突出,对入侵检测系统提出了更高的要求,当前IDS的最大问题是不能快速检测出新出现的异常入侵和较高的误报率。人
随着计算机体系结构、程序设计语言等的不断丰富,以及计算机应用的快速发展,软件系统规模不断增大,任务复杂度不断提高,软件的并发性不断加强,软件潜在的bug已越来越难以捕捉。由
地质研究是非常重要的基础研究工作。但对于工程地质建模与可视化分析系统具有一定软件规模的软件研究,国内外尚未有相关的成熟软件产品。随着计算机技术的发展和地质建模方法
自然景物的真实感绘制一直以来都是视景仿真的一个重要组成部分,云、雾、烟、雪、水流、火花等自然景物由于缺乏规律性给研究带来了很大的挑战,传统的造型方法很难逼真的模拟这
随着Internet的快速发展和Web信息的日益增长,个性化推荐服务越来越受到用户青睐。作为个性化推荐的核心技术,预测模型得到了广泛关注,并成为一个具有挑战性的研究课题。对预测
本文阐述了数据库系统安全防护研究和发展,研究和分析了各种先进的安全技术,从数据加密、身份认证、访问控制、数据库管理员与安全管理员职责分离几个方面考虑设计了一套数据分
随着科学技术的日益进步,物流系统逐渐成为现代社会经济系统的重要支柱,物流总成本已在国民生产总值中占有相当的比重。物流配送是企业与消费者在物流活动中直接相连的环节,在物