论文部分内容阅读
当今时代是一个互联网的时代,具体表现为互联网规模越来越大,网络流量越来越多,能够有效并可控地监管网络流量和用户行为的方法,越来越得到网络管理者们的关注和期盼,而如何合理使用并处理网络数据,提取网络特征对端主机及用户行为进行有效分类和识别也由此成为各高校学者和研究机构的研究热点。但是,目前的针对端主机的识别和用户行为分类等研究基本处于相对空白的状态。针对上述的端主机识别和分类的研究现状,本文详细地分析了网络流特征,构建了用户行为谱的模型,并将其用于网络流特征的提取和统计,接着引入机器学习技术,提出了基于流特征的端主机识别方法和基于网络连接特征的端主机行为分类方法,从而完成对端主机及其行为模式的识别和分类。具体工作如下:1、提出了一种新的基于流特征的端主机行为识别方法。具体方法是,我们主要针对小型网络中的端主机,通过捕获网络通信数据包,构建用户行为谱模型,基于流特征进行分析,基于所构建的模型,对网络数据进行DNS解析,接着对表征流级行为的特征数据进行提取和统计,得到属于每台主机在某天的行为特征参数矩阵,再对其进行“奇异值分解”的处理,得到若干组能够表征端主机行为特点的特征向量,最后通过改进的数据挖掘技术分类算法中的C4.5算法对端主机进行了行为类型的识别,以及以其他的方法中采用的特征参数集作对照组进行结果对比,结果表明,引入了用户行为谱和奇异值分解处理的主机识别方法较之传统的统计特征识别方法能够取得较好的效果。2、提出了一种基于网络连接特征的端主机行为分类方法。我们主要针对小型网络中的端主机,基于对网络连接特征的分析和处理,提出对端主机的行为分类方法,我们同样基于用户行为谱的模型,处理得到表征每台主机每天的行为特点的特征参数矩阵,通过计算并使用其矩阵相似度,用来构造节点的连接关系矩阵和连接图。接着,我们考察了用户网络行为及偏好趋势的稳定性。最后我们通过合理定义节点信息和边权重,应用社团划分算法中的GN算法处理节点连接关系图,得到了最后的社团划分结果,并对其进行了详细的分析和解释,并通过对社团中真实节点的用户进行提问,验证了社团划分结果的正确性和合理性。实验证明,本方法可以有效的区分所研究的小型网络中的主机用户的行为模式,并对其进行合理的、有意义的分类。