分布式聚类及其在入侵检测中的应用研究

来源 :南京师范大学 | 被引量 : 0次 | 上传用户:wlxingyun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类分析是数据挖掘领域的一项重要研究内容,它在金融、电信、保险业、市场营销、异常检测、网络安全、科学决策等方面具有十分重要的应用价值,因此受到研究人员的高度重视。已有的聚类算法大多只适用于集中式数据的聚类。由于网络带宽、站点存储量、信息安全及隐私保护等限制,把不同站点的数据全部集中到某一个中心站点进行全局聚类几乎是不可能的。所有站点数据集中在一起,数据量会非常庞大,聚类效率会显著降低。本文对分布式聚类方法作了一些较深入的研究,取得了如下成果:1.提出了高效的分布式k均值聚类方法DK-Means。该方法在站点间只传送少量聚簇信息,有效降低了分布式聚类过程中的数据通信量,并能达到与k均值算法等效的聚类质量。理论分析及实验结果表明,DK-Means是一种有效可行的分布式聚类算法,对于高维数据集同样有效。2.针对聚类数目难以确定的问题,提出了分布式聚类方法α-DK-Means,通过分割和合并聚簇将训练数据集划分成适当数目的聚簇而不必预设聚簇半径。实验结果表明,该方法是有效可行的。3.针对基于密度的分布式聚类算法DBDC通信量大、效率低的缺点,提出了一种基于密度的分布式聚类方法DBDC~*。有效降低了分布式聚类过程中的数据通信量,全局聚类时综合考虑了各站点数据的分布情况,能够对任意形状分布的数据进行聚类。实验结果表明,该方法是有效可行的,对于高维数据集同样有效。4.提出了一种适用于入侵检测的数据预处理方法,定义了类别型属性各取值之间的差异度,使得在对训练集进行无监督学习生成检测模型过程中,能够同时有效地处理数值型属性和类别型属性。理论分析表明,我们所定义的类别型属性值差异度既保留了类别型属性各取值之间的本质特征,同时也没有改变数据集的原始维数。实验结果表明,采用该数据预处理方法进行聚类所建立的入侵检测模型能更有效的检测攻击。5.提出了一种基于分布式聚类的异常入侵检测方法ID-DC。该方法建立在一种无中心的多Agent分布式体系结构之上,通过对训练集进行分布式聚类产生聚簇模型,采用基于双参考点的标识算法标记异常簇,不需要具有类别标签的训练集且可自动确定聚簇模型的个数。实验结果表明,通过该方法所建立的分布式入侵检测模型可有效检测攻击。6.在JAVA平台下设计并实现了基于Agent的分布式入侵检测系统原型,在该系统中实现了基于分布式聚类的入侵检测方法,利用分布式聚类方法建立入侵检测模型。实验测试结果表明,该方法能有效检测各种攻击并且具有对未知攻击的增量学习能力。
其他文献
计算机及网络技术的迅速发展,给人们的现代生活带来了方便、快捷的新鲜享受。人类开始进入信息时代、电子商务时代。我们的生活越来越数字化,无纸社会近在眼前。互联网改变了
本体作为一种能在语义和知识层次上描述信息和数据的概念模型,在智能信息检索、知识的获取、表示、分析和应用等方面发挥着至关重要的作用。然而由于本体构建工具的多样性、
传统移动业务接入方式是通过业务引擎接口协议直接接入通信网元的,但是电信技术和能力被SP所使用并不是一件容易的事情,Parlay X开放业务体系结构为抽象的电信业务提供了一套
本文在研究IEEE802.1X协议的基础上,通过在OPNET仿真软件中构造带有认证功能的节点模型,根据其仿真结果来测试无线网络中认证过程对网络性能的影响。文中首先简要介绍了无线网
移动通信发展到3G时代,数据业务的带宽有了很大的增长,这为数据业务的发展提供了一个很好的基础。提供多样化、有吸引力的数据业务成为发展3G的当务之急。传统移动业务接入方
过程层析成像技术是从医学CT技术发展起来的,以多相流为主要研究对象,并对多项流中的过程参数在线实时检测,进行多相流参数检测可获得多相流体二维或三维的时空局部的、微观
研究表明高等真核生物中普遍存在选择性剪切现象,选择性剪接的异常会引起转录组异常而导致某些疾病的发生,如帕金森病、早老性痴呆、强直性肌营养不良等。因此,转录组表达的
两相流体具有复杂性的流动特性,流型的准确识别是两相流参数准确测量的基础,流型的在线智能识别是两相流研究的重点内容之一。电阻层析成像(ERT)技术是基于电阻传感机理的过
AFDX网络作为现代航空电子系统网络的重要体系结构,AFDX网络确定性评估的准确性是保障整个航空电子系统安全性的关键,发达国家使用AFDX的机型都必须采用数学方法来证明网络的
随着嵌入式系统软件(如嵌入式操作系统)的发展成熟,嵌入式软件开发的重点已经由前期的嵌入式系统软件开发转向嵌入式应用软件的开发上来。一个功能强大的面向应用开发的嵌入