论文部分内容阅读
PAM是基于k-中心值聚类的一种算法,在处理数据集的聚类问题时,具有良好的准确性和伸缩性.但PAM算法在随机选取初始中心点时存在不足,而且在处理存在孤立点或噪声的数据时算法不是很健壮.本文针对这两点不足,使用了数据场的概念对PAM聚类算法进行了有益的改进,提高了算法的准确性和处理孤立点或噪声的能力,使其更适合于对数据集的处理,提高了挖掘结果的质量.