Kafka消息系统可靠性研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:chener
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随着互联网的高速发展,storm、s4、spark、streaming等大数据实时计算框架广泛应用于实时监控、实时推荐、实时交易等系统。为了能够实时消费数据流,Kafka消息系统得到了广泛部署,但随着数据实时性增强,Kafka消息系统可靠性面临巨大挑战。目前Kafka消息系统主要通过消息队列实现数据的实时分发,其可靠性主要通过数据的一致性来保证。当前消息队列数据不一致性主要有两方面原因引起,一方面是由集群中主、从副本间数据不一致导致,为了能使数据一致,从副本通常采用同步方式进行数据备份,但需要花费大量的网络、磁盘、内存等额外开销,使得集群负载加大;另一方面由于消息生产速率与消息落盘速率不匹配,导致数据缓存溢出,造成数据丢失,同步式消息生产虽然能解决数据丢失问题,但会影响消息集群的吞吐能力。针对以上问题,论文通过分析现有Kafka消息队列机制,研究Kafka消息系统的可靠性,具体完成以下工作:1.针对Kafka消息队列在副本数据同步过程中,集群负载增大的问题,提出基于消息热度的副本自适应同步策略。该策略通过预估消息热度,动态采用强一致性策略和弱一致性策略更新副本数据;并搭建kafka集群,与Kafka2.10的副本数据同步策略进行实验对比,结果表明自适应一致性同步策略不但能够保证消息副本的一致性,而且可以显著降低额外资源开销,提高集群的吞吐速率。2.针对Kafka消息队列采用消息缓存机制实现消息异步分发,会存在缓存溢出导致数据丢失的问题,提出基于消息热度的多级缓存机制,采用WFQ多队列调度算法实现公平的队列调度,以保证其数据落盘的公平性。并与Kafka2.10进行了实验对比,结果表明采用基于消息热度的多队列缓存策略后,不仅降低了数据消费的延时,还保证了消息队列的可靠性;综上所述,研究Kafka消息队列的主副本数据一致性策略及消息分发机制,是保证Kafka消息系统可靠性的有效途径,具有重要的理论参考价值和实用意义。
其他文献
随着我国逐渐向着知识经济时代的方向迈进,各项科学技术发展和应用的速度也得到了大幅度的提升,随着各项极为先进的工艺措施在我国社会各个行业中的相关企业中的应用,其生产
<正>近年来,场外证券市场在支持实体经济、中小微企业、科技创新,满足多元化投融资需求,支持场内市场发展,完善多层次资本市场体系方面发挥了积极的作用,但与此同时,场外证券
会议
本文回顾了90年代台湾股市危机,并研究股市泡沫的形成机制。经过格兰杰因果关系检验验证,得出如下结论:金融自由化浪潮下,台湾当局放宽外汇管制,热钱流入;为平缓台币升值速度
元认知策略可以帮助学生对听力学习进行自我规范和调整,从而提高学生的学习成绩。元认知策略效果的好坏会影响学生的听力水平。在英语教学中,教师应该加强对学生元认知策略的
随着经济的发展,我国部分企业实力的增强,企业间的并购行为已经成为迅速实现企业扩张、扩大企业规模、增强企业盈利水平的重要手段,不仅包含了国内范围的并购,而且包含海外跨
概述本文主要论述缅甸穆斯林的组成及其与云南伊斯兰世界的融合,文章还分析了他们的穆斯林身份在适应中国文化的过程中所引起的一些问题.
新生儿洗胃目的是清除在胎儿分娩过程中吞入被胎粪污染的羊水,感染的羊水,及含较多母血的羊水,以减少其刺激胃黏膜引起胃酸及黏膜分泌亢进所致的呕吐。临床上采取早期洗胃方
目的:探究在ICU患者压疮管理中实施集束化护理策略的临床效果。方法:临床纳入2013年5月至2014年8月间在该院ICU进行治疗的患者110例,按随机投掷法进行分组,对照组55例行一般
羊毛/桑蚕丝的混纺面料因具有优良的吸湿性、保暖性、染色性及触觉效应,而成为高品质的服装面料。实际生产中往往会掺入其它的纤维来降低成本。国家标准中的硫酸法溶解羊毛/