基于数据挖掘的电信行业中客户流失模型的研究与实现

来源 :浙江理工大学 | 被引量 : 0次 | 上传用户:hunyuan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来客户流失在电信行业中异常严重。对于移动、联通、电信三大运营商来说,谁能保障自己的客户不流失,同时又能够获取从其他运营商流失的客户资源,谁无疑是最后的赢家。为了实现这样一种美好的愿景,各大运营商也纷纷采取了不同的手段来获取更多的客户资源。然而,目前运营商投入了过多的关怀给予已经离网的客户,而对那些正在减少他们的ARPU值的客户关注过少,殊不知在未来的某天这些客户即将流失。电信行业的数据具有海量性且多元性。所谓多元性是指每一个客户都具有众多的属性,在数据挖掘模型中称为变量,如ARPU、付费方式、停机次数等。为了更好地建模,本文首先进行了变量探索,基于对用户潜在流失原因的假设,从提醒类、感知类、价值行为类三个方面设计宽表。接着对变量进行了分组,决定哪些变量参与建模,哪些不参与建模。通过变量分组,结合客户自身的特点,对客户进行分群。电信行业中客户流失模型的研究越来越多,为了提高模型的命中率,本文提出了一种组合模型理念,基于约束模型、预测模型、评分模型对组合模型CPM进行建模实现。约束模型关注区分度较大的变量,预测模型筛选对客户流失影响较为显著的变量,评分模型选择对客户流失影响不大的变量,以弥补样本小样性的缺陷。每一种模型针对的客户群不同,如此一来,本文提出的组合模型在挖掘潜在客户流失方面将发挥更出色的作用。本文建模采用IBM SPSS Statistics,提出了蚁群算法中信息素差值的概念,利用改进的蚁群算法进行客户细分,提高了客户聚类的效果。同时正则转化消除系数量纲的影响,建模中采用逻辑回归算法替代决策树来规避变量区分度不高的问题,并逐步增大逻辑回归算法中迭代次数提高变量探索的准确性,并引用决策树算法、因子分析等对变量进行分析。最后的模型评估表明了该组合模型具有动态性、稳定性以及全面性。约束模型反应了商业中的动态变化,预测模型保证了模型的稳定性和精确性,评分模型利用小样本保障了样本的全面性。
其他文献
风湿病是壮医治疗的优势病种之一,壮医药在防治风湿病方面具备一定特色,正逐步受到国内外医学界的关注。本文就风湿病的各种壮医外治疗法研究进展做一综述,以期具有悠久历史
我国手机行业的发展历经十余年,手机已经成为人们日常生活中不可或缺的一部分,手机营销的渠道也从最初的全国代理商形式发展到国代商、省代、直供、运营商定制等多种渠道并存
海湾生态系统能为人类提供各种生态服务功能,对人类生存与发展有着重要意义。然而,海湾由于其特殊地理位置,暴露在频繁的人类开发利用活动和自然灾害扰动下,使得海域生态环境
目的研究慢性乙肝患者血清标志物和病毒载量之间相关性。方法血清HBV DNA测定用荧光定量分析PCR法和乙肝标志物采用化学发光酶免疫定量法,分别对222例慢性乙肝患者血清HBV DN
改革开放以来,我国不同省份之间的经济差异不断扩大。由于各区域的客观自然因素和政府制定的主观发展政策的影响,区域经济差异成为发展中明显存在的问题。虽然我国学者对于区域
<正>一边强力反腐整顿官场不良习气,一边进行制度建设,为"嵌入式自主性"打下基础,是中国转型成功的必由之路。这段时间林毅夫和张维迎的产业政策之争被炒得沸沸扬扬,这热闹不
目的探讨可有效地促进医患关系和谐的新型护理模式。方法主要分析语言沟通和行为举止沟通两个方面在新型护理模式中的作用。结果护理人员语言的情感性、道德性、语言环境和听
目的:探讨紫草素对A549人肺癌细胞凋亡的影响和可能的作用机制。方法:采用不同浓度的紫草素对体外培养的A549人肺癌细胞进行干预,CCK-8法和流式细胞术分别检测紫草素对A549细
目的对200例恶性浆膜腔积液进行回顾性研究,分析临床资料及细胞形态,以总结经验,提高恶性浆膜腔积液检出率及细胞学诊断水平。方法对200例恶性浆膜腔积液进行8个年龄组的划分
糖尿病肾病(Diabetic Nephropathy,DN)是糖尿病发展过程中重要的并发症之一,最终可导致肾衰竭甚至死亡。DN总属中医"脾瘅"、"水肿"、"消肾"、"关格"、"溺毒"等范畴,本文从肾