论文部分内容阅读
随着宽带网络的普及、计算机性能的提高以及大容量存储的出现,各种基于Internet的网络电视服务(IPTV)大量出现,尤其是基于P2P技术的P2P IPTV应用,其产生的流量已经占据了整个互联流量的绝大多数,这些大规模部署的商业系统采用私用且非公开的体系结构和协议,其中有很多系统对数据采用加密的手段,其给网络的有效监管带来困难,因此实现对这些应用产生的数据流进行高效识别,进而进行测量、监测、引导、控制显得尤为重要。本文首先对P2P系统的发展、分类、特点和应用进行了详细分析研究,阐述了P2P网络给网络安全管理带来的挑战,介绍了P2P IPTV的特点,与P2P文件共享系统的差别,以及P2P IPTV系统测量的方法。本文选择国内非常流行的四种P2P IPTV系统——PPlive, PPStream, Kankan和QQlive作为研究对象,通过部署实验平台,选用基于嗅探的被动测量方法,分别获取四种系统产生的数据流,设计数据过滤规则,最终获得实验数据集。基于该数据集,对四种系统的流量特征和节点行为特征进行了研究并将它们进行了比较,获得了许多重要的发现。其次,本文详细分析了P2P IPTV流媒体流量识别的方法、优缺点和识别评价指标,并对机器监督学习的流程进行了分析,分析比较了目前特征提取和训练集的发展与现状。详细介绍了SVM技术原理,特点,核函数,多分类技术,引进数据包负载分布特征,并对特征进行维度精简,引入拒绝判断机制,重新设计多分类过程。最后,使用实验数据集,通过实验选择最优的核函数,时间窗,精简特征和拒绝阀值。实现了对四种P2P IPTV流媒体流量高精度细粒度识别,同时该方法对未知流量也具有非常高的识别精度。