电商交易数据实时计算平台设计与实现

来源 :华南理工大学 | 被引量 : 1次 | 上传用户:xialiaoj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
实时计算又称流处理,是一个从数据产生,就即时采集计算的过程,能够满足更快运算和分析的需求。大数据技术的出现和发展,为海量数据的处理提供新的解决方案。最初基于Hadoop构建的离线批处理系统,通过HDFS存储,Map Reduce、Hive计算的模式来实现。目前,这套模式通常用来构建大型数据仓库。传统的基于数据仓库的查询统计,首先通过ETL技术将各个业务系统的数据同步到数据仓库,形成ods层数据集,在此基础上进行数据开发。数据仓库存储的往往是T-1的数据,无法满足对数据实时处理的需求。虽然可以将数据的调度时间调整到30分钟到数小时不等,这种方式具有高吞吐量、耗时长的特点,可以满足对时效性要求不高的离线分析报表的需求。但是,越来越多的应用场景通过离线批处理的方式已经满足不了需求,企业希望能够对流数据进行在线实时处理和即时响应,因为这些数据的价值是有时效性的。而实时计算技术的出现和发展,加快了数据的处理过程,让数据产生更大的价值。本文基于蓝月亮对实时处理电商交易数据、埋点数据、生产制造数据等的需求,探讨了构建统一的大数据实时计算平台的设计和实现过程。实时计算平台处理数据的流程如下:首先通过canal解析My SQL binlog日志写到本地文件,接着Flume进行采集写入分布式消息队列Kafka,最后由分布式实时计算框架Storm拉取Kafka上的数据进行计算处理,计算结果写入到高速缓存组件Redis中。同时,平台还构建了分布式索引服务elasticsearch,来满足实时索引的需求,以及对实时计算过程中遇到的脏数据进行存储和后续分析。
其他文献
专业实践创新活动对于培养大学生的实践能力有着重要的促进作用.在正确的培养方式下,通过不同专业的实践创新活动,能够使大学生将所学到的知识学以致用.这对优良学风的建设有
随着流行趋势的轮回,“复古”、“怀旧”等具有历史感的产品又重现舞台,深受大家喜爱。在这一大环境下,一些具有独特文化韵味的传统手工艺正在悄然兴起,这其中就包括徐行草编
摘 要:“教育的根本是立德树人”是党在十八大报告中对教育根本目标进行的阐释和规定,当前高校思想政治理论课教学无疑是实现这一任务的直接阵地。笔者在多年的政治理论课教学实践中,总结以下“五个结合”,即在育人过程中重视教育目标导向与合理方法相结合,教师的师德示范与学生的主体学习相结合,意识领域的开放包容与核心价值的循循善诱相结合,教学的主导功能突出与各种优势资源整合相结合,理论的认知听懂与实践中的领悟升
武术段位制教程是科学兴武的时代成果,是对长久以来学校武术发展问题的反思和改革,其根于传统、打练合一、内外兼修的教学模式,使武术教育回归了本真,契合于学校体育教育的要
本文利用长江经济带9省2市的税收和经济数据进行量化分析,从省际、税种、产业结构三个角度分析了长江经济带的区域税负水平、变化趋势以及税负差异特征,然后采用了固定效应模