论文部分内容阅读
天猫超市的快递箱深入大街小巷,与此同时,以前比肩接踵的实体大超市却门可罗雀。本文希望利用Hadoop这一高效迅速的数据分析平台,在实验室模拟超市小票数据及商品信息数据挖掘,针对不同的场景,设计对应的数据模型,比如,基于关联规则摆放货架上的商品,基于内容推荐算法进行商品推荐,以期提出一种合理可行的超市营销决策模型,该模型能理论上提高实体超市销售额和收益。首先,本文研究了分布式平台Hadoop和挖掘超市数据两者的契合性。国外大型超市有利用Hadoop分析超市销售数据以预测顾客行为的例子,国内也有利用Hadoop对大规模数据分析的例子。同时,超市内有足够硬件设施能够快速的搭建这一平台。接着,以超市销售小票数据,商品数据,会员数据为研究对象,对商品种类进行关联规则分析,把商品种类销售所带来的利润和关联规则结合,从而得出货架摆放规律。同理,利用推荐系统对客户进行商品推荐时,也基于商品的价值和利润进行两个场景三个规则的推荐。本文对提出的数据模型进行了实验,并将实验结果和传统数据分析工具进行对比,得出的结论证实该理论合理可行,并具有一定的优越性。在实际超市营销策略制定上有推广价值。