基于机器学习的网络入侵检测方法研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:tjkjkfzx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
如今各种网络攻击层出不穷,对个人和企业乃至国家带来了严重的危害,网络入侵检测方法提供了一种主动的防御措施。随着人工智能技术的不断进步,基于机器学习的网络入侵检测方法成为学者们的一个研究热点。目前,基于机器学习的网络入侵检测方法存在着如下两个问题:网络入侵检测数据通常是类别不平衡数据,这会导致分类器对少数类攻击的召回率(recall)低;此外,网络入侵检测数据中存在的冗余和不相关的特征会导致网络入侵检测的精度(accuracy)下降。针对网络入侵检测模型对少数类攻击的召回率低的问题,本文提出了一种基于簇内样本平均分类错误率的混合采样算法(Hybrid Sampling Based on Average Classification Error Rate of Samples Within a Cluster,简称HSACEC)。该算法定义了“簇内样本平均分类错误率”的概念,对多数类样本进行聚类后,根据“簇内样本平均分类错误率”采集有代表性的多数类样本;此外,HSACEC算法采用SMOTE(Synthetic Minority Over-sampling Technique)方法对少数类进行过采样。紧接着,本文将HSACEC算法与BP(Error Backpropagation)神经网络相结合以建立一个网络入侵检测模型。实验验证了采用HSACEC算法的网络入侵检测模型能有效提高G-mean值以及对少数类攻击的召回率。针对冗余和不相关的特征导致网络入侵检测的精度下降的问题,本文提出了一种基于OVO(One-versus-one)的多评价准则的改进的LVW(Las Vegas Wrapper)特征选择算法(Improved LVW Based on Multiple Evaluation Criteria for OVO,简称LVW-MECO)。首先,LVW-MECO算法将基分类器的精度作为特征子集的评价准则,对OVO分解策略中的所有基分类器分别进行包裹式的特征选择,为各个基分类器找出不同的特征子集;然后,LVW-MECO算法将基分类器的F1值作为特征子集的评价准则,再次对验证集上F1值较低的若干个基分类器分别进行包裹式的特征选择,这些基分类器前后各选出两个特征子集;最后,以基分类器组合而成的多分类器的验证集精度作为依据,这些基分类器分别从各自选出的两个特征子集中选出最佳的特征子集。紧接着,本文将LVW-MECO算法与BP神经网络相结合以建一个网络入侵检测模型。实验验证了采用LVW-MECO算法的网络入侵检测模型能有效地提高分类精度和检测率(detection rate)以及降低误报率(false alarm rate)。
其他文献
硼在促进番茄生长及果实品质方面具有重要作用。深入研究其影响机制,可预防生理病害、减少农药和化学防腐剂的使用,并为实际栽培生产提供理论依据。目前,前人已对硼在植物中
由于实际过程中存在着各种不确定因素,为了避免破坏约束,需要保证在不违反约束和经济性能最优的前提下对设计变量增加裕量。本文考虑过程中不确定参数的随机分布,结合灵敏度
2014年,互联网工程任务组(The Internet Engineering Task Force,IETF)的自治网络集成模型方案(Autonomic Networking Integrated Model and Approach,ANIMA)工作组提出了一
椭圆钢管混凝土是一种新型截面形式的组合构件,主要由椭圆钢管内填充核心混凝土形成。常见的圆、方钢管混凝土具有承载力高,自重轻,塑性好等性能,这得益于钢管混凝土良好的套
本文对四川盆地高石梯-磨溪地区寒武系龙王庙组和震旦系(埃迪卡拉系)灯影组的储层沥青,寒武系筇竹寺组、震旦系(埃迪卡拉系)灯影组及陡山沱组的烃源岩及龙王庙组的天然气样品进行
话语权和主动权是一个国家具备国际竞争力的表现,而创新能力不仅能带动一国经济增长的发展,而且是在国家间激烈角逐中夺得头筹的重要法宝。以经济和科技为核心的综合国力的强大才是一个国家核心竞争力的重要表现。在当今时代,中国正处于经济转型升级的至关重要的时刻,为了保持中国经济可持续健康发展,必然要走一条属于中国的技术创新之路。经济环境的日益开放,促使中国一方面不断学习高精尖技术来独立创新,另一方面也为中国提
随着互联网的飞速发展,网络流量分类技术在网络管理和网络安全领域的重要性日益凸显。基于机器学习的网络流量分类方法具有分类精度高、可扩展性强等特点,得到了广大研究人员的青睐,但流量样本分布不均衡、分类模型更新不及时等问题依然突出。本文对基于监督学习的网络流量分类方法进行了分析与研究,主要研究内容如下:1.针对网络流量样本分布不均衡导致分类器的性能被大类别淹没,忽略小类别的分类精度的问题,提出一种基于相
曲流河砂体储层是重要的陆相碎屑岩储层类型,也是我国陆相盆地中储层研究的热点及难点。油田开发中后期,定量分析曲流河砂体的形态和规模,对油气勘探开发具有重要的意义。论
能源的大量消耗与需求促使电能存储技术在近几年发展迅速。因为具有无污染、理论比容量高等众多的优点,广泛认为锂硫电池是繁多的电池种类中比较有前景的其中之一。虽然锂硫
年径流控制率是目前海绵城市建设工作验收的重要考察指标。该指标现有的评估方法存在着评估范围有限、监测难度高等问题。针对上述问题,本研究以海绵模块监测代替区域监测,研