论文部分内容阅读
自然界一直是人类创造力的丰富源泉,人类认识事物的能力来源于自然界的相互作用之中,自然界的许多自适应优化现象不断给人类以启示。智能算法是人们受自然规律或生物界规律的启迪,根据其原理,模仿某些规律而设计的求解实际问题的一类算法。它将复杂任务交给群体中大量的个体合作完成,具有概念简单、实现方便的特点。由于智能算法具有的分布性、简单性、灵活性和健壮性,已在计算机科学、知识发现、通信网络、机器人等研究领域广泛应用,成为一个研究热点。近几十年来,一些与经典的数学规划原理截然不同的,试图通过模拟自然生态系统机制以求解复杂优化问题的仿生智能优化算法相继被提出和研究。如模拟退火算法、遗传算法、人工神经网络技术、人工免疫算法和群智能算法等。这些算法大大丰富了现代优化技术,也为那些传统优化技术难以处理的优化问题提供了切实可行的解决方案。数据挖掘是从存贮在数据库、数据仓库或其它信息仓库中的,大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。数据挖掘最常用的技术有关联规则、序列模式分析、分类分析和聚类分析等。这些技术很多都涉及到优化问题,完全可以用智能优化算法来解决和处理。如何将数据挖掘技术和智能算法结合起来,使数据挖掘技术可以为智能算法服务,或者智能算法可以用到数据挖掘中,这无疑是一个很有意义的问题。如果这两种技术或算法能够成功的结合,消除各自的缺点和不足,充分利用彼此的优点,这是百利而无一害的事。同时,将对大规模数据的数据挖掘将指出一条行之有效的方法,也是对智能算法很好地、新颖独特地探索。本文的主要工作如下:1.在并行粒子群算法中,引入围绕中心点的划分PAM(Partitioning AroundMedoid)聚类技术来划分整个种群为几个相互不重叠的子种群。通过聚类,相同子种群的粒子相对集中,从而它们能够较容易地相互学习。这使得有限的时间能够花费在最有效的搜索上,以便提高算法的搜索效率。为了均匀地探测整个解空间,引入均匀设计来产生初始种群,使种群中的种群成员或个体均匀地分散在可行解空间中。进化过程中,使用均匀设计产生的较好个体替换种群中的较差个体,已达到优胜劣汰的目的。2.在多目标粒子群优化算法中,为了维持或增加种群的多样性,帮助算法跳出局部最优,分别引入PAM聚类算法和均匀设计来产生和选择Pareto最优解。提出了一个新的基于PAM和均匀设计的多目标粒子群优化算法。3.在关联规则挖掘中,评价关联规则需要重复扫描数据库来比较数据库中的每个记录与规则的前件,后件和整个规则。为了减少比较的次数和时间消耗,提出了属性索引策略。它只需要扫描数据库一次就能创建每一个属性的属性索引,然后所有评价关联规则的度量值不再需要扫描数据库,而仅仅通过属性索引就能得到这些值。关联规则挖掘被看作多目标而不是单目标问题,为了在目标空间中获得均匀分散在Pareto前沿的解,精英策略和均匀设计被引入。本文提出基于属性索引和均匀设计的多目标演化规则挖掘,它不再要求用户指定最小支持度和最小置信度,而仅仅使用属性索引。它设计了新的实属编码,以便扩展它的应用范围。4.使用几个评价指标,成功率、成功数和完全成功率来度量聚类算法的性能或有效性。为了正确地获取它们,提出了两个新的类别分配算法,一个能够最大化几个评价指标;另一个能够确保每个簇至少包含一个矢量数据。为了验证它们的有效性,应用它们来评价几个聚类算法的性能。5.为了克服粒子群PSO(Particle Swarm Optimization)算法的早熟收敛,引入动态交叉到PSO中,形成CPSO。将此算法引入到k均值算法中,以便克服k均值算法只能发现球形簇,对初始点的选择较敏感的缺陷。最后将此聚类算法应用到图像分割中,得到很好的图像分割结果。