基于自动确定类数技术的聚类算法研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:gusano1987
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
将物理或抽象对象的集合分成由类似的对象组成的多个类的过程被称为聚类。聚类算法是一种高效的无监督学习方法,被广泛应用于许多领域,包括机器学习,数据挖掘、模式识别、图像分析和生物信息学等。但是已有的聚类算法仍存在一些难点问题,例如复杂数据集中存在的簇间密度不均匀、聚类形态多样、聚类中心的识别等。针对这些问题,本文设计研究了相应的聚类算法以改进现存的问题,提高聚类算法的性能。具体研究内容如下:(1)针对人工参与选定聚类中心点和类数不恰当导致聚类结果不理想的问题,本文提出了一种自动确定正确的聚类中心点和聚类中心数目的聚类算法。该算法将密度峰值聚类算法思想与遗传算法思想相结合,首先,通过密度峰值聚类算法初步对数据集进行聚类,通过密度峰值聚类算法的决策图选出远大于正确聚类中心点数的点作为候选聚类中心点,再使用遗传算法并结合聚类评估指标作为适应度函数从候选聚类中心点中选出最好的聚类中心点和聚类中心数目,以改善人为的参与决策图中聚类中心点选定导致的聚类效果差以及随机性的问题。经过大量的实验与改进,最终结果表明,针对人工参与聚类中心点选定的问题,设计的自动确定类中心和类数的聚类算法不但能减少人工干预的程度,极大改善了人工选择聚类中心点导致的随机性和不确定性的问题,而且能够高效的识别出正确的类数和聚类的中心点。将新提出的算法与其他典型主流聚类算法进行实验对比,聚类效果更好更准确。(2)针对已有的聚类算法在分布不均匀的数据集上聚类时易丢失稀疏簇,从而导致的聚类效果差的问题,本文提出了一种适用于密度分布不均匀数据集的聚类算法。已有的聚类算法对密度分布不均数据集聚类效果差的主要原因是将稀疏区域的数据点当作噪声处理了,进而导致稀疏簇丢失,聚类效果差。所以,研究密度分布不均数据的聚类算法需要研究方法识别稀疏区域的点使其不被当作噪音点被处理。为了使稀疏区域的中心点不被当成噪音点被排除,使聚类算法能够识别出稀疏区域的类中心点,本文提出的聚类算法通过改造密度峰值聚类算法的局部密度函数,使稀疏区域中心点的局部密度变大,这样在决策图上稀疏区域的中心点也能被识别为候选中心点,从而识别出稀疏簇,稀疏区域的点就不会被当做噪声点被排除。实验结果表明,在多个测试数据集上用新的聚类算法进行聚类,能够识别到稀疏簇的聚类中心点,最终的聚类结果更加精准、聚类更具有健壮性。在一些数据集上,将本算法与其他典型主流聚类算法进行实验对比,聚类效果更加理想,新的算法达到了预期的实验结果。
其他文献
图像识别相关的深度学习技术在近些年取得了快速的发展。图像识别技术使机器具有了感知环境、识别物体的能力,极大推动了现代工业智能化的发展,可以看到有越来越多的相关应用相继落地。对抗样本通过在原始图像中添加人眼难以察觉的细微的扰动信息,就可以使深度学习模型产生错误的判别结果。对抗样本的存在给深度学习算法和模型造成了威胁,甚至影响了实际中相关深度学习应用的安全。特别是在自动驾驶、人脸识别和金融等对安全性要
近年来,物联网已经从一个新兴概念发展成为了现今社会的热门话题。物联网的应用场景已经不知不觉的渗入了人类社会的各个角落,同时伴随着嵌入式计算机系统、传感器器件、射频识别技术、近场通信、Wi Fi和Zig Bee等技术的进步。其中射频识别被认为是改变生活质量最有潜力的技术之一。电子标签与阅读器在超高频频段进行通信无需物理接触,读写效率高,结构简单,部署方便,能够适应各种应用场景的需求。然而受到硬件功耗
图像融合将来自多个传感器的图像进行组合,最终获取一幅信息更完整的图像。图像融合技术在医学领域主要应用于临床诊断,通过将病变部位的多模态图像进行组合,有利于医生更加准确地进行病变部位定位,提高诊断准确率。本文研究了基于反卷积神经网络自适应变换的CT/MRI医学图像融合算法。论文研究内容如下:提出了基于反卷积神经网络的图像自适应变换方法。为获得待融合图像的最佳变换,利用高斯方向滤波器设计具有不同截止频
唐19-12断块馆陶组具有构造幅度低、砂层薄、横向变化快等特点,本文对地震资料进行了攻关处理,在此数据基础上开展了精细构造解释,通过层控网格层析速度建模,运用变速成图技术,重新落实了唐19-12断块低幅度构造。通过钻井证明,运用该技术落实的构造形态与真实构造形态吻合度高,为唐19-12断块后期的勘探开发工作提供了技术支撑和井位部署依据。
水下无线光通信系统(Underwater Wireless Optical Communication,UWOC)拥有更高的数据速率,更低的时延和更好的安全性等特点,作为一种应用于军事和工业领域的关键技术受到广泛关注。但是UWOC也存在诸多问题,光束在水下信道传播时会受到海水吸收、散射效应以及海洋湍流效应的综合影响而产生严重的衰减。为了提高通信质量以及延长传输距离,可以采用信道编码等技术,同样也可
区块链是一种去中心化的分布式账本平台,作为分布式数据存储、对等网络、共识机制、密码算法等技术的集成,具有去中心化、可溯源、不可篡改等特点。近些年来,应用场景多元化的需求助推了区块链技术的迅速发展,逐步诞生了以比特币、以太坊、超级账本为代表的区块链平台,其系统安全性主要由经典密码学中基于大数分解或是离散对数问题的公钥密码算法和哈希函数提供保障。然而,随着量子计算机的问世,上述主流区块链平台均面临着以
遥感图像的语义分割是遥感图像处理中的一种重要方法,它能为后续的图像识别和场景理解提供必要的基础。遥感图像分辨率大且场景比较复杂、目标尺寸差异大和存在易混淆的物体,这些都会给分割的任务带来更多的挑战。针对上述的这些问题,本文的主要研究内容如下:(1)提出了基于多尺度自适应权重信息流融合算法(MWFNet)用于遥感图像语义分割。为了解决遥感图像的目标多样性和尺寸差异大的问题。提出多尺度编码模块,使用5
在现代战争中,军用飞机扮演着越来越重要的角色。面对严峻的防空环境,作为博弈的一种有效手段,飞机突防技术也趋向于综合化、复杂化和智能化,突防难度越来越高。设计优良的突防航路可以有效缩短航路长度,提高突防成功概率,为作战任务的成功实施提供保障。因此,对突防航路规划技术的研究需求变得越来越迫切。本文针对复杂防空环境下的突防航路规划问题,通过分析不同典型威胁源的特性并建模,生成威胁数字灰度地图。根据飞机进
随着三维点云技术的发展,人们不再满足于二维平面图像,开始向三维领域发展。深度相机可以从场景中获取三维信息,因此被广泛应用于需要更可靠三维信息的人机交互(HCI)和增强现实(AR)。由于深度相机由于其精度的提高并且变得更加便宜和流行,以至于可以部署在智能手机上,研究人员开始积极研究利用深度信息的三维计算机视觉。与深度相机拍摄的深度图像(称为2.5D信息)相比,研究人员试图将深度图像转换为三维点云或通
语义分割是计算机视觉领域的重点关注问题,也是场景理解的基石性任务。近年来,深度学习在图像处理、语音识别等领域表现优异,因此语义分割任务也更倾向于采纳深度学习方法,来实现更精准的分割预测。目前,最出色的语义分割方法往往借助全卷积神经网络的结构形式,以此来获取逐像素的分类预测。然而,语义分割是一项密集标注任务,需要在获得目标语义信息的同时对其进行精确定位。而现有的神经网络模型往往会在提取特征的过程中损