一种基于半监督学习的网络攻击流量的检测方法研究

来源 :西南科技大学 | 被引量 : 0次 | 上传用户：zzw200512168

【摘要】

：

【作者】

：

瞿梦成

【机构】

：

西南科技大学

【出处】

：

西南科技大学

【发表日期】

：

2022年01期

【关键词】

：

网络安全半监督学习异常检测集成学习

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着当今互联网的快速发展,网络安全事故越来越频繁地发生,网络攻击行为的检测也得到了研究人员的越来越多的关注,其中机器学习的相关技术为网络攻击流量的检测提供有力的支持。根据机器学习算法对训练集标签的需求,可将其分为无监督学习、有监督学习和半监督学习算法,由于不同的算法间对于训练数据集的要求不同,各个算法会在分类的任务中有着不同的表现。其中仅采用无监督训练的算法不依赖训练集的标签,能够在最低数据成本的条件下达到较好的二分类效果,但由于缺乏有标签训练集的引导,会导致模型检测性能较差,并且难以对具体的网络攻击类型进行分类;而采用有监督学习的算法往往会有着最好的分类效果,但其算法流程过于依赖训练集的标签数据,使得人工标注成本过高,当缺少有标签训练数据集时,会严重影响检测模型对网络攻击流量检测的性能;而基于半监督学习的算法可以利用少量标签数据集建立初始分类模型,然后利用大量的无标签数据集进一步强化初始模型的分类效果。本文提出了一种基于半监督学习的网络攻击流量检测算法,目标是解决单纯依靠无监督或者有监督学习带来的检测缺陷以及标签数据集的成本问题。算法基于提升方法原理（Boosting）的集成学习算法,通过自训练的方式结合模糊值判定实现半监督分类模型的训练。并基于此算法设计并实现了一套实时网络攻击流量检测系统,包含流量数据包采集、攻击流量检测、可视化管理这三个功能模块。流量数据包采集模块基于DPDK（Data Plane Development Kit,数据平面开发套件）,保证了流量数据的高效获取;攻击流量检测模块基于本文所提出的算法,采用少量标签数据集与大量无标签数据集进行训练,降低了算法应用时的数据集获取成本。算法的测试采用NSL-KDD数据集,实验结果表明,本文的多分类检测模型的准确率在KDDTest+和KDDTest-21测试集上分别达到95%和91%,达到了攻击流量检测准确率达到90%以上的目标。本文的流量检测系统已在某医疗机构的机房中部署试运行,运行期间系统对攻击流量的通报及时准确,且系统所有的模块运行平稳,给医疗系统的数据安全提供了有力的保障。

其他文献

东昆仑造山带二叠-三叠纪花岗质岩浆性质及对成矿的制约

学位

基于“互联网+”与无线通信的锂电池状态参数在线测控研究

学位

注册制下超额配售对IPO定价效率的影响研究

学位

旅游社区居民生计演变影响因素及机制研究 ——以邛崃市马坪村为例

学位

内蒙古阿巴嘎旗巴彦图嘎萤石矿床地质特征及找矿方向

阿巴嘎旗位于内蒙古中东部,该地区大地构造位置位于中亚造山带中部。该区域为萤石矿成矿的有利位置,成矿及找矿潜力巨大。本次工作以巴彦图嘎萤石矿床为研究对象,结合现代成矿作用及成矿预测理论对研究区构造、地层、岩浆岩、成矿流体进行了研究。利用重力异常、航磁异常、地球化学异常、磁法及电法进行找矿方法组合研究进行成矿预测并圈定成矿靶区。取得认识如下:（1）区域性北东向脆性断裂对岩体和地层的分布起重要控制作用,

学位

巴彦图嘎萤石矿成矿地质特征找矿标志成矿预测阿巴嘎旗

货币政策对黄金价格的影响研究

学位

金融发展、信贷资源错配与实体经济增长的实证研究

学位

长白山天池及邻区火山建造特征与地质填图

近年在长白山天池及邻区钻探了一系列深浅不一的钻孔,最深达4500m。揭示的地层序列结果表明,长白山天池火山及邻区火山地层序列自下而上可分为五个构造层序:（1）前新生界构造层,包括白垩系、侏罗系、奥陶系-寒武系、元古界和太古界。（2）中新世-更新世造台-造盾期洪泛玄武岩与湖沼相泥质沉积互层,穹隆状、盾状粗面岩、安山岩和玄武岩组合。（3）更新世-全新世造锥期碱流岩、黑耀岩、熔结凝灰岩和紫红色玄武质火山

学位

长白山天池火山地质火山建造火山地层地质填图

日本Nankai海槽天然气水合物储层三维非均质模型构建及多分支井产能预测

学位

基于系统动力学的储备政策对猪肉价格影响研究

学位

一种基于半监督学习的网络攻击流量的检测方法研究

其他学术论文