论文部分内容阅读
为了满足人们对高性能计算日益增长的需求,数据中心的规模呈现快速增长,单个数据中心可容纳着成千上万的服务器,这些服务器进行着高效的数据处理及高速的数据传输。随着数据中心承载业务量的增加,注入数据中心网络的数据量急剧增长,瓶颈链路上由于无法处理过量的数据产生拥塞,出现吞吐崩溃。尤其是在线业务对数据中心内数据传输的流完成时间提出了限制,过长的响应时间将大大降低用户体验,从而降低数据中心运营商收益。现代数据中心应用要求网络具有高吞吐(40Gbps)及超低时延(每跳小于10us),并保证低CPU开销。然而标准的TCP/IP栈无法很好地满足数据中心的高带宽和低时延的需求。本文对数据中心的拥塞监测进行了研究,详细分析了基于队列与基于时延的拥塞衡量标准及其模型。其次,总结了数据中心拥塞控制的研究现状,根据目标不同,分别介绍了优化流完成时间的拥塞控制方案和解决incast问题的拥塞控制方案,进行了优劣分析。低流完成时间和高网络利用率是未来数据中心的性能指标和设计诉求,本文从降低分组排队时延和减少分组丢弃的角度提出两种高效的数据中心网络拥塞控制策略。排队时延是流完成时间的重要组成部分,而基于队列的拥塞控制方案对时延并不敏感,无法有效监测或限制分组排队时延,造成不理想的流完成时间性能。针对此问题,本文提出一种基于分组排队时延的拥塞控制策略QDCN(Queue Delay based Congestion Notification),直接对分组排队时延及其变化进行监测和限制,实现网络状态的变化进行快速响应。另外,基于分组排队时延的计算,结合出队列标记技术,使得网络拥塞信号得到加速传输,进一步缓解网络拥塞状况。仿真结果显示,该拥塞控制策略在一定条件下可有效降低15%的流完成时间。在credit调度方案中,发送方终止接收方credit分组产生的方式会浪费大量的credit分组,而这些credit分组会造成网络链路用率降低。针对此问题,本文提出了一种基于credit主动终止的拥塞控制策略ECS(End-to-end Credit Scheduled Congestion Control),通过监测发送端数据流的传输状况,本文建立预测模型对未来发送端数据流截止时刻及所需要的credit分组进行预测,接收端将credit分组发送数目增加到某一合理水平并主动停止credit流发送。这样,在保证网络需求得到满足的情况下,credit分组的浪费率被尽可能的降低。仿真结果显示,该拥塞控制策略有效减少credit分组浪费率;在高流量负载的情况下,小流流完成时间可以改善约25%。