基于网络流和连接特征的端主机分类

来源 :电子科技大学 | 被引量 : 2次 | 上传用户:nikun0081
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当今时代是一个互联网的时代,具体表现为互联网规模越来越大,网络流量越来越多,能够有效并可控地监管网络流量和用户行为的方法,越来越得到网络管理者们的关注和期盼,而如何合理使用并处理网络数据,提取网络特征对端主机及用户行为进行有效分类和识别也由此成为各高校学者和研究机构的研究热点。但是,目前的针对端主机的识别和用户行为分类等研究基本处于相对空白的状态。针对上述的端主机识别和分类的研究现状,本文详细地分析了网络流特征,构建了用户行为谱的模型,并将其用于网络流特征的提取和统计,接着引入机器学习技术,提出了基于流特征的端主机识别方法和基于网络连接特征的端主机行为分类方法,从而完成对端主机及其行为模式的识别和分类。具体工作如下:1、提出了一种新的基于流特征的端主机行为识别方法。具体方法是,我们主要针对小型网络中的端主机,通过捕获网络通信数据包,构建用户行为谱模型,基于流特征进行分析,基于所构建的模型,对网络数据进行DNS解析,接着对表征流级行为的特征数据进行提取和统计,得到属于每台主机在某天的行为特征参数矩阵,再对其进行“奇异值分解”的处理,得到若干组能够表征端主机行为特点的特征向量,最后通过改进的数据挖掘技术分类算法中的C4.5算法对端主机进行了行为类型的识别,以及以其他的方法中采用的特征参数集作对照组进行结果对比,结果表明,引入了用户行为谱和奇异值分解处理的主机识别方法较之传统的统计特征识别方法能够取得较好的效果。2、提出了一种基于网络连接特征的端主机行为分类方法。我们主要针对小型网络中的端主机,基于对网络连接特征的分析和处理,提出对端主机的行为分类方法,我们同样基于用户行为谱的模型,处理得到表征每台主机每天的行为特点的特征参数矩阵,通过计算并使用其矩阵相似度,用来构造节点的连接关系矩阵和连接图。接着,我们考察了用户网络行为及偏好趋势的稳定性。最后我们通过合理定义节点信息和边权重,应用社团划分算法中的GN算法处理节点连接关系图,得到了最后的社团划分结果,并对其进行了详细的分析和解释,并通过对社团中真实节点的用户进行提问,验证了社团划分结果的正确性和合理性。实验证明,本方法可以有效的区分所研究的小型网络中的主机用户的行为模式,并对其进行合理的、有意义的分类。
其他文献
近年来,互联网与社会经济发展和人们生活的关系越来越密切。计算机和网络已经成为社会不可或缺的重要部分,而互联网的安全问题也随之而来。其中,网络蠕虫是最大的安全隐患之
从1984年CCITT发布第一个视频编码标准H.120以来,视频压缩编码技术获得了迅猛的发展,一系列视频编码标准陆续公布,从MPEG-1到MPEG-4,从H.263到H.264,这些标准的发布极大推动
Web技术的革新使其逐渐成为网络内容生产和消费的平台,互联网上充斥着无数以网页形式存在的信息源,随着搜索引擎、网络监控和新闻推送等应用和研究工作的深入发展,使得互联网
近年来,地基干涉合成孔径雷达(GB-InSAR)应用于形变监测领域已引起了广泛关注,比如山体滑坡监测、大坝监测以及冰川监测等。该监测系统具有测量精度高、测量距离远,能在几十
在上世纪九十年代,我国著名学者陈难先教授等人提出了无穷级数的Mobius变换理论,开创了应用、推广数论中的Mobius变换解决物理学中各种逆问题的巧妙方法,在1990年就得到了世界著
多模型(MM)滤波和粒子滤波(PF)是当前处理机动目标跟踪中非线性非高斯问题较为有效的目标状态估计方法。粒子滤波用一组采样粒子来描述目标状态的后验概率密度,摆脱了非线性滤
语种识别是利用计算机对一定长度的语音材料进行处理,判别其所属语言种类的过程,是语音识别的一个重要研究方向。随着经济全球化的不断深入,语种识别在日常生活、国防军事和公共
随着通信技术的迅猛发展,人们对通信的要求也越来越高。原来以话音业务为主要服务的通信网已经越来越力不从心了。随着视频聊天,在线影视等多媒体技术的普及,迫使服务提供商
前视双基地SAR(Bistatic Forward-looking SAR)(BFSAR)是对双基地SAR基本工作模式的一种扩展,能对飞行路线正前方区域进行较高分辨率成像,能消除侧视模式中存在的固有成像盲
宽带相控阵雷达是现代雷达发展的趋势,可同时执行多种功能、跟踪多批目标,具有判定目标属性,测量目标事件参数和具有很高的雷达搜索和跟踪数据率。但是阵元数目很多的宽带阵列,运