基于改进K-means算法的客户行为聚类识别

来源 :南京工业大学 | 被引量 : 4次 | 上传用户:wangbp20021225
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着客户对个性化消费要求的提高,企业为了获得竞争优势,已将客户的个性化需求摆在十分重要的位置上。客户的个性化需求离不开对客户行为数据的聚类分析,但是企业的客户数据类型复杂、数量巨大,在进行个性化聚类挖掘时面临着数据挖掘方法和数据挖掘平台选择的多重困难,所以企业对于客户行为数据挖掘方法和平台难题的解决已经迫在眉睫。因此,本文以新一站电商保险平台为切入点,着重解决新一站平台在对客户进行聚类时遇到的挖掘算法和平台的难题,为新一站保险平台的客户个性化服务提供基础,最终能够在市场竞争中获得优势。为了解决新一站客户行为数据的挖掘过程中遇到的难题,本文首先分析总结了目前大数据、数据挖掘、聚类和客户行为的研究现状,并以此为基础总结了目前通用的研究方法,为研究分析打下了坚实的理论基础。之后,为了进一步分析新一站平台客户行为的背景,具体分析了新一站平台的框架结构、购物流程、客服流程、客户行为、以及客户特征等多方面,对接下来新一站客户聚类挖掘有着重要的作用。在总结和分析了现有聚类研究的基础上,本文根据新一站客户数据的特点,选择了 K-means作为聚类分析的基础,通过改进人工蜂群算法中的初始化过程、选择策略、领域调整策略以及新解生成机制,改善了原先人工蜂群算法的存在的不足,并利用改进之后的算法与K-means相结合为K-ABC算法,从而弥补K-means算法存在的依赖初始值等缺陷,提高了算法的有效性和可靠性。根据选择算法的特点以及目前数据处理平台的比较,选择了 Hadoop作为数据处理平台,并进行了聚类方法的并行化部署。最后本文通过新一站客户数据,在Hadoop平台上进行了实验,证明了融合后聚类算法K-ABC的有效性,并成功的实现了对新一站客户的聚类。本文改进了经典人工蜂群算法中的初始化过程、选择策略、领域调整策略以及新解生成机制,提高了人工蜂群算法效率性和鲁棒性;并利用改良后的人工蜂群算法与K-means相结合,弥补了单独使用K-means算法的缺陷。本文的研究为众多企业利用客户行为数据进行客户聚类挖掘提供了一定的技术层面的支撑。
其他文献
通过对日处理城市生活垃圾能力为750t/d的垃圾焚烧发电锅炉系统热效率分析研究可知,该系统可以有效的处理城市生活垃圾,年处理垃圾量约为25万吨,其热效率可达到80.65%,对其热
目的阐述中医经方治疗崩漏的临床应用体会。方法笔者收集近五年在临床上治疗的崩漏案例,通过经方六经辨证,先辨阴阳,次辨归经,再辨方证,以求得方证对应来应对临床上各种原因
<正>上海交通大学舆情研究实验室新鲜出炉的第三季度《中国社会舆情应对能力评估分析报告》给出这样的一条信息:以微博为代表的新媒体正异军突起,成为企业、个人舆情应对的重
本文以100kVA、3000r/min、16极钕铁硼永磁发电机为例,对其组合充磁特性进行实验、计算研究。并对其研究结果进行了讨论、比较,提出了今后进一步研究的意见。
目的:筛选紫草抗人乳头瘤病毒(HPV)的有效部份。方法:用系统溶媒(石油醚、乙醚、乙酸乙酯、正丁醇、乙醇、蒸馏水)对紫草依次进行提取,应用荧光定量聚合酶链反应技术(FQ-PCR)
为了提高对弱目标的检测与跟踪能力,采用一种基于阵元域数据驱动的联合检测与跟踪算法。在假定多目标信号互不相关,且目标个数已知的条件下,采用最大后验(MAP)方法从阵元域数
<正>今年,城西区采取"企业预存、财政补助、放大使用"的方式,按照1:1.3的比例向辖区青越投资管理集团有限公司党支部、西宁兆维电子科技有限公司党支部等6家非公经济党组织累
近年来,随着金融脱媒、利率市场化进程加速,银行业所处的经营环境日益复杂多变。同时,云计算、大数据与人工智能等新兴互联网技术蓬勃发展,开放、平等、分享、协作的互联网精
<正>2015年11月30日,2015中国国际海事技术学术会议和展览会(简称"第18届中国国际海事会展")开幕式在上海浦东嘉里大酒店举行,会展为期4天。工业和信息化部副部长怀进鹏、上
目的彩超指引下治疗膝关节腔积液。方法应用超声检查确诊膝关节腔积液并指引穿刺抽液治疗。结果经彩超指引下治疗膝关节腔积液定位准确,治愈16例,有效13例,无效1例。结论经彩