基于改进引力搜索算法的SVM参数优化和特征选择

来源 :云南大学 | 被引量 : 0次 | 上传用户:gzalpha
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机和互联网的全面普及,数据库技术以及相关的数据采集、数据存储技术的高速发展,各行各业中数据分析需求越来越多数据,挖掘技术扮演着越来越重要的角色。随着计算机相关技术的进一步发展,大数据时代到来,数据的规模越来越大维度越来越高,在这些大规模高维数据中并非所有的数据都是有用的信息,其中存在着大量冗余的、无关的特征,给当前数据挖掘技术带来了巨大挑战。这时,数据降维就显得非常必要。而特征选择作为一种降维方法也成为数据挖掘的研究热点,发展迅速。本文介绍了特征选择的一般过程、相关搜索策略和优化算法,并分析了特征选择的研究现状和主要研究方向。根据支持向量机(SVM)分类器的优点,采用SVM特征选择,并提出一种改进的引力搜索算法(GBGSA)用于特征子集的搜索,并对SVM进行参数同步优化,构建一个基于改进引力算法的SVM特征子集选择系统。首先,介绍了 SVM和几种群智能算法的基本原理,并介绍了利用群智能算法对SVM进行参数优化和特征选择方法。然后,详细地介绍了引力搜索算法(GSA),以及在二进制空间中的二进制引力算法(BGSA)。同时针对引力算法易陷入局部最优解及解精度不高等问题,引入遗传算法的交叉变异思想,采用锦标赛的选择方法对粒子种群进行交叉操作,提出一种自适应变异方法对粒子转移速度进行变异操作,进而提出了一种改进的引力搜索算法(GBGSA)。并根据对基准函数的测试,验证所提算法的优良性。最后,利用所提出的改进引力搜索算法,同步优化SVM参数和特征选择,构建GBGSA-SVM系统。根据在UCI数据集上的实验,对比遗传算法和引力搜索算法的优化结果,验证了算法的优良性。并利用GBGSA-SVM对白内障危险因素进行研究分析,为白内障病理研究和相关预防提供了一定的参考价值。
其他文献
运用完全分解模型,将2001~2015年我国能源消费变化的驱动效应分解为人口效应、收入效应、结构效应、能耗强度效应,并分析我国能源消费结构变化。研究发现:(1)三大产业能耗比重
改革开放40年来,中国经济从复苏迈上高速发展快车道,同时也伴随出现了发展质量不高、发展不均衡不平衡等问题,2014年习总书记提出我国经济发展进入新常态,明确了中国经济在重要战略机遇期的重要方向,指明了我国经济要在稳中求进总基调下努力改革创新,要主动适应、把握、引领经济新常态。保险业作为中国特色社会主义市场经济中的重要产业,为我国经济高速增长作出了重要贡献。与此同时,保险业也出现了服务保障能力不够、
随着我国城市机动车数量的不断增长,交通拥堵已成为制约城市发展的重要原因。公共交通的道路资源占用较低,载客数量较多,运输效率高的特点。所以,优先发展公交能够有效缓解城市交通压力,提高交通效率,改善交通拥堵现状,促进城市交通健康发展。我国当前越来越多的环形交叉口选择将无信号控制改为有信号控制,亦或是将环形交叉口重建为十字交叉口,但因成本过高且不利于对周边植被的保护,故后者的方案较逊色于前者的方案。然而
为防治灵芝的哈茨木霉病害,对土壤细菌进行筛选,得到1株具有抑菌效果的菌株,编号为JSW-0601,初步测定了JSW-0601对哈茨木霉的抑菌效果,并与11种生防药剂进行对比,通过分子生
二氧化碳是一种造成全球气候变暖和环境变化的主要温室气体,对二氧化碳的捕获和存储是稳定大气中二氧化碳浓度的有效手段之一。为此,对二氧化碳等气体的选择性吸附研究,日益
目的探讨全容积三维超声(FV3DE)及组织多普勒技术(TDI)评价慢性肾脏病(CKD)患者右心房容积及右心功能的临床价值。方法CKD患者60例,将CKD1~3期定为Ia组,CKD4~5期定为Ib组;正常
<正>如今,电视上相亲节目肆虐,生活中相亲活动泛滥,网络上甚至出现了"虚拟男女友"的服务,这些现象表明社会大众对于择偶非常焦虑。择偶,顾名思义就是选择配偶。作为影响婚姻
本文主要从软交换提出的必然性、软交换的概念和主要功能、基于软交换的增强型业务框架,以及其各层间的协议等方面对软交换技术进行了论述,并且对软交换技术在电力通信网中的
背景与目的:已有研究证明,Ang Ⅱ能通过TGF-β1介导促进胶原合成,在器官纤维化发病中起一定作用。进一步的研究证实,血管紧张素转换酶抑制剂(ACEI)及AT1受体拮抗剂能下调Ang Ⅱ
<正>慢性阻塞性肺疾病(chronic obstructive pulmonary disease,COPD)简称慢阻肺,是一种以持续气流受限为特征的可预防和治疗的疾病,其气流受限多呈进行性发展,与气道和肺组