新型自收敛的蚁群算法在聚类问题的研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:zx0755
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的高速发展,数据库应用的规模、范围和深度空前发展,人们迫切需要一种自动地和智能地将待处理的数据转化为有用的信息和知识的方法,从而达到为决策服务的目的。在这种情况下,数据挖掘技术应运而生。数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。本文对数据挖掘技术,尤其是聚类分析进行了较为深入的研究与分析,并且针对聚类问题提出了一种改进的算法。本文主要完成以下工作:   本文在研究了基本蚁群聚类模型、经典LF算法以及引入了信息熵的LF算法的基础上,提出了新型自收敛的蚁群聚类算法(SCAC)。针对蚁群聚类算法聚类的精确度不高,并且对参数设置过于敏感的问题,本文首先对蚁群聚类算法提出两点改进方法:动态调整概率转换函数的阈值和设置蚂蚁搜索禁忌表。动态调整概率转换函数的阈值是指对概率转换函数的阈值随着运算进行调整,以达到不同阶段蚂蚁采取不同的拾起和放下概率的目的,提高聚类的精确率。设置蚂蚁搜索禁忌表是为了避免在同一次迭代中,蚂蚁重复对同一数据对象进行运算,减少算法运算的时间。最后本文提出一种自收敛模型。在改进的蚁群算法运算之后,对聚类结果作自收敛运算,能提高聚类的精确度并使蚁群算法降低对参数设置的依赖。   最后本文采用UCI的机器学习数据库中的标准测试数据进行实验,结果证明改进的蚁群聚类算法在运行时间,分类错误率,聚类的精确度上优于前期的蚁群聚类算法。
其他文献
指纹识别是生物特征识别技术中实践应用最早和最广泛技术,采用计算机进行指纹识别的自动指纹识别系统也取得了巨大的发展。指纹识别的过程主要指纹采集、指纹识别预处理以及指
数据库管理系统(DBMS)是除操作系统外最重要的系统软件,是信息系统的核心,也是我国信息化建设中应用最广泛、需求量最大的基础性软件。为掌握数据库管理系统实现的核心技术,研发具
对国内外数据流频繁项集挖掘研究情况分析可知,以往的挖掘算法还存在诸多问题。简单的频繁项集挖掘由于没有采用合理的约束思想,挖掘出的频繁项集相当庞大;增量挖掘方法大部
随着计算机网络技术的不断发展,网络的规模和复杂性也在不断增加,如VOIP、VOD、视频会议等一些新型的实时网络应用,不仅对网络的带宽要求高,对QoS(Quality of Service,服务质量)的要
VoIP是一种在IP网络上传送语音信号,并以此推出相应增值业务的技术。由于它不需要专属网络,允许用户共享带宽资源,因而能在IP网络上廉价地提供语音、视频和数据等服务。随着VoIP
全自主移动机器人在未来将起着越来越重要的作用。同时定位与地图创建利用机器人自身携带的传感器感知周围的环境以确定机器人在环境中的位置以及对环境进行建模,是实现真正自
互联网技术及其应用推动了计算机技术的快速发展,人们对数据存储的需求已经有了很大的改变,主要表现在要求存储系统具有巨大的存储容量,希望能够对数据进行快速存取和有效的管理
当用户向搜索引擎提交查询后,搜索引擎向用户返回命中网页的标题、URL和网页摘要,网页摘要对于用户快速了解网页概要、提高搜索效率具有重要的作用。人们对传统的文本自动摘要