论文部分内容阅读
本文研究和分析了基于划分的K-means算法和基于密度的DBSCAN算法,结合两种算法的优点和不足给出了一种改进的算法——DBSK算法。该算法由于划分了数据集,降低了对主存的要求;算法中给出了计算各局部数据集参数的方法;对于分布不均匀的数据集,由于各个局部采用不同的参数值,使得算法对全局参数的依赖性降低,聚类质量更好。文章最后介绍基于聚类技术的客户细分系统的设计及实现。