论文部分内容阅读
随着互联网金融行业的快速发展,银行业对于数据挖掘和机器学习技术的运用越来越多。基于银行数据库中的客户个人信息、交易信息、账户资产信息等数据,银行可以挖掘出很多潜在价值,从而提高银行的业务盈利与运营效率。本文基于某商业银行数据库中的客户数据,利用机器学习算法,在客户画像的基础上对客户进行聚类分析,再根据不同聚类客户的特点,从银行金融业务的不同属性出发,挖掘客户的需求和价值,为银行制定个性化标签化的营销策略,从而达到精准化推广营销的目的,同时构建分类预测模型,对样本数据中有流失风险的客户进行预测。根据银行的实际业务需求,本研究利用前端开发技术,从多角度对银行大数据进行了分析,最后设计并实现了银行大数据可视化平台。具体包括:(1)研究了机器学习中的特征选择与聚类算法,抽取在客户行为分析中影响较大的特征变量,提出了利用K-means聚类算法对客户进行聚类分析的方法,并在三种情况下对客户群进行聚类,然后对聚类结果进行判别比较分析,当聚类个数k分别为5、6、7时,平均准确率分别为99.28%、97.77%、98.24%,所以在聚类个数为5的情况下在准确率最高。通过观察各客户群的特征,构建客户画像,并提出了相应的精准营销策略,最后实现了聚类结果的可视化展示。(2)研究了机器学习中的随机森林算法、Logistic算法、决策树算法,并对原始数据中的风险客户进行预测,分析了3种算法的预测准确率和ROC曲线,研究发现以上三种算法的预测准确率分别为93.2%、88.7%、90.6%,同时,ROC曲线的实验结果表明,随机森林算法在进行银行大数据分类预测时效果较好,最后实现了预测结果可视化展示。(3)设计并实现了银行数据可视化分析平台。通过丰富的可视化展现工具,分别实现了银行个人客户数据的可视化、银行网点数据的可视化以及银行客户群体轨迹的可视化。