电商交易数据实时计算平台设计与实现

来源 :华南理工大学 | 被引量 : 1次 | 上传用户：xialiaoj

【摘要】

：

实时计算又称流处理,是一个从数据产生,就即时采集计算的过程,能够满足更快运算和分析的需求。大数据技术的出现和发展,为海量数据的处理提供新的解决方案。最初基于Hadoop构

【作者】

：

陈振华

【出处】

：

华南理工大学

【发表日期】

：

2020年01期

【关键词】

：

实时计算 Storm Binlog Canal Kafka

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

实时计算又称流处理,是一个从数据产生,就即时采集计算的过程,能够满足更快运算和分析的需求。大数据技术的出现和发展,为海量数据的处理提供新的解决方案。最初基于Hadoop构建的离线批处理系统,通过HDFS存储,Map Reduce、Hive计算的模式来实现。目前,这套模式通常用来构建大型数据仓库。传统的基于数据仓库的查询统计,首先通过ETL技术将各个业务系统的数据同步到数据仓库,形成ods层数据集,在此基础上进行数据开发。数据仓库存储的往往是T-1的数据,无法满足对数据实时处理的需求。虽然可以将数据的调度时间调整到30分钟到数小时不等,这种方式具有高吞吐量、耗时长的特点,可以满足对时效性要求不高的离线分析报表的需求。但是,越来越多的应用场景通过离线批处理的方式已经满足不了需求,企业希望能够对流数据进行在线实时处理和即时响应,因为这些数据的价值是有时效性的。而实时计算技术的出现和发展,加快了数据的处理过程,让数据产生更大的价值。本文基于蓝月亮对实时处理电商交易数据、埋点数据、生产制造数据等的需求,探讨了构建统一的大数据实时计算平台的设计和实现过程。实时计算平台处理数据的流程如下:首先通过canal解析My SQL binlog日志写到本地文件,接着Flume进行采集写入分布式消息队列Kafka,最后由分布式实时计算框架Storm拉取Kafka上的数据进行计算处理,计算结果写入到高速缓存组件Redis中。同时,平台还构建了分布式索引服务elasticsearch,来满足实时索引的需求,以及对实时计算过程中遇到的脏数据进行存储和后续分析。

其他文献

专业实践创新活动对大学生学风建设的促进机制研究

专业实践创新活动对于培养大学生的实践能力有着重要的促进作用.在正确的培养方式下,通过不同专业的实践创新活动,能够使大学生将所学到的知识学以致用.这对优良学风的建设有

期刊

专业实践创新活动学风建设促进机制研究

徐行草编艺术研究及创新设计实践探索

随着流行趋势的轮回,“复古”、“怀旧”等具有历史感的产品又重现舞台,深受大家喜爱。在这一大环境下,一些具有独特文化韵味的传统手工艺正在悄然兴起,这其中就包括徐行草编

学位

徐行草编工艺技法传承与发展创新设计

“立德树人”在高校思想政治理论课教学中实现的“五个结合”

摘要：“教育的根本是立德树人”是党在十八大报告中对教育根本目标进行的阐释和规定，当前高校思想政治理论课教学无疑是实现这一任务的直接阵地。笔者在多年的政治理论课教学实践中，总结以下“五个结合”，即在育人过程中重视教育目标导向与合理方法相结合，教师的师德示范与学生的主体学习相结合，意识领域的开放包容与核心价值的循循善诱相结合，教学的主导功能突出与各种优势资源整合相结合，理论的认知听懂与实践中的领悟升

期刊

立德树人高校思想政治理论课教学五个结合

烟台市芝罘区小学武术教学运用段位制教程的可行性研究

武术段位制教程是科学兴武的时代成果,是对长久以来学校武术发展问题的反思和改革,其根于传统、打练合一、内外兼修的教学模式,使武术教育回归了本真,契合于学校体育教育的要

学位

武术段位制教程可行性小学

长江经济带区域税负研究

本文利用长江经济带9省2市的税收和经济数据进行量化分析,从省际、税种、产业结构三个角度分析了长江经济带的区域税负水平、变化趋势以及税负差异特征,然后采用了固定效应模

学位

长江经济带区域税负税负差异基尼系数

电商交易数据实时计算平台设计与实现

其他学术论文