论文部分内容阅读
近年来客户流失在电信行业中异常严重。对于移动、联通、电信三大运营商来说,谁能保障自己的客户不流失,同时又能够获取从其他运营商流失的客户资源,谁无疑是最后的赢家。为了实现这样一种美好的愿景,各大运营商也纷纷采取了不同的手段来获取更多的客户资源。然而,目前运营商投入了过多的关怀给予已经离网的客户,而对那些正在减少他们的ARPU值的客户关注过少,殊不知在未来的某天这些客户即将流失。电信行业的数据具有海量性且多元性。所谓多元性是指每一个客户都具有众多的属性,在数据挖掘模型中称为变量,如ARPU、付费方式、停机次数等。为了更好地建模,本文首先进行了变量探索,基于对用户潜在流失原因的假设,从提醒类、感知类、价值行为类三个方面设计宽表。接着对变量进行了分组,决定哪些变量参与建模,哪些不参与建模。通过变量分组,结合客户自身的特点,对客户进行分群。电信行业中客户流失模型的研究越来越多,为了提高模型的命中率,本文提出了一种组合模型理念,基于约束模型、预测模型、评分模型对组合模型CPM进行建模实现。约束模型关注区分度较大的变量,预测模型筛选对客户流失影响较为显著的变量,评分模型选择对客户流失影响不大的变量,以弥补样本小样性的缺陷。每一种模型针对的客户群不同,如此一来,本文提出的组合模型在挖掘潜在客户流失方面将发挥更出色的作用。本文建模采用IBM SPSS Statistics,提出了蚁群算法中信息素差值的概念,利用改进的蚁群算法进行客户细分,提高了客户聚类的效果。同时正则转化消除系数量纲的影响,建模中采用逻辑回归算法替代决策树来规避变量区分度不高的问题,并逐步增大逻辑回归算法中迭代次数提高变量探索的准确性,并引用决策树算法、因子分析等对变量进行分析。最后的模型评估表明了该组合模型具有动态性、稳定性以及全面性。约束模型反应了商业中的动态变化,预测模型保证了模型的稳定性和精确性,评分模型利用小样本保障了样本的全面性。