您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。 [TIPDM]:第一届挑战赛A3-航空客户忠诚度与价值分析 - 发现报告

第一届挑战赛A3-航空客户忠诚度与价值分析

2013-04-22 TIPDM 喜马拉雅
报告封面

题目航空客户忠诚度与价值分析航空客户忠诚度与价值分析航空客户忠诚度与价值分析航空客户忠诚度与价值分析队长彭晨彭晨彭晨彭晨枫枫枫枫成员李立宇李立宇李立宇李立宇学校(院系)汕头汕头汕头汕头大学计算机系大学计算机系大学计算机系大学计算机系指导教师姜大志姜大志姜大志姜大志孙浩军孙浩军孙浩军孙浩军完成时间2013201320132013 年年年年 4444 月月月月 5555 日日日日 综合评定成绩: 评委评委评委评委评语评语评语评语: 评委评委评委评委签名签名签名签名:::: 航空客户忠诚度与航空客户忠诚度与航空客户忠诚度与航空客户忠诚度与价值分析价值分析价值分析价值分析 摘摘摘摘要要要要::::根据对客户保持的研究表明“顾客忠诚度提高 5%,企业利润将增加 25.125%”,建立新客户的难度是保持老客户的 5-10 倍,维系老客户的营销成本远远低于获取新客户的成本。本文基于国内某航空公司超过 60000 个会员数据,结合现有成熟的客户管理模型,在对数据样本集进行预处理后通过数理统计的方法对样本属性进行相关性分析,挑选出对构建行为忠诚度模型高影响的因子,构建客户的忠诚度价值模型。同时基于客户价值区分 RFM 分析法,建立基于均值的 RFM 模型、基于聚类的 RFM 模型和基于 PCA 处理后的 RFM 模型对客户价值水平分类,且评估三种不同的方法在客户分类上的侧重点。 关键词关键词关键词关键词::::客户管理;忠诚度;RFM;相关性分析;聚类;PCA;价值分类 Aviation customer loyalty and value analysis Abstract:According to customers's research suggests that "the customer loyalty increase 5%,corporate profits will increase by 25.125%", set up the difficulty of the new customer is 5 to 10 times tokeep old customers, maintain old customers marketing costs well below the cost to acquire new customers.This article is based on a domestic airline by more than 60000 members, combined with the existing maturecustomermanagement model,after preprocessing the data set by mathematical statistics method,correlation analysis was carried out on the sample properties, pick out the high influence factor for theconstruction of behavior loyalty model, build the loyalty of the customer value model. Based on thecustomer value to distinguish the RFM analysis at the same time, based on the mean of the RFM model, theRFM model based on clustering and the RFM model based on PCA after processing level of customervalue classification, and evaluation of three different methods to focus on customer classification. Key words:Customer management; Loyalty; RFM; Correlation analysis; Clustering; PCA; Value ofclassification 目录 1.研究目标研究目标研究目标研究目标............................................................................................... 6 2.分析方法与过程分析方法与过程分析方法与过程分析方法与过程.................................................................................... 6 2.1.总体流程..................................................................................................................... 62.2.具体步骤.....................................................................................................................72.3.结果分析.....................................................................................................................8 1.挖掘挖掘挖掘挖掘目标目标目标目标 本次建模目标是利用太普公司提供的 62988 个航空公司的样本数据,其中包括有 63 个属性,共8 个季度用户飞行的真实数据[1]。对所有的数据样本进行预处理,除去缺失值的样本数据后,通过对传统客户保持管理的模型[2]分析,结合数理统计[3]中的一系列方法,从 63 个属性中筛选出对客户行为忠诚度[4][5][6]影响高的因子,根据权衡忠诚度高影响的因子构建客户的忠诚度模型[7][8][9]。同时,基于 RFM 客户价值量分析法[10][11],并结合忠诚度高影响因子构建 RFM 均值处理数据的模型、聚类[12][13]处理客户数据后的 RFM 模型和 PCA[14]降维后筛选高特征值的 RFM 模型,对客户价值水平进行分类,比较三种不同方法在客户分类上的优势与侧重点,为后期的营销策略打下前期基础。 2.分析方法与过程分析方法与过程分析方法与过程分析方法与过程 2.1.总体流程总体流程总体流程总体流程 步骤一:样本数据预处理。步骤二:Pearson积矩系数分析,提取强相关性的因子。步骤三:构建客户的忠诚度模型。步骤四:建立均值RFM模型对客户分类。步骤五:建立K-means RFM模型对客户分类。步骤六:建立PCA RFM模型对客户分类。 2.2.具体步骤具体步骤具体步骤具体步骤 步骤 1:样本数据预处理对构建模型不相关的属性去除,在筛选出来的属性中除去有缺失值的样本,最后挑选出 62294 个有价值的样本。 步骤 2:Pearson积矩系数分析利用Pearson方程在数值数据处理方面的优势,计算出属性之间的相关度,并结合客户管理忠诚度现有成熟的模型,对属性再次处理,筛选出对构建模型直接有效的属性样本。同时通过Pearson方程计算,发现客户的交易金额和积分具有强相关性,两类属性之间有超过92%的相关度。 步骤3:根据已选出来的属性,分别有3大类:(1)客户近期交易时间;(2)客户交易频率;(3)客户交易金额。 其中,(1)客户近期交易时间具有客户距离前一次飞行间隔时间、客户平均飞行间隔、客户乘机最大时间间隔三个属性。(2)客户交易频率具有前一季飞行次数、前四季飞行次数、前八季飞行次数三个属性。(3)由步骤二的Pearson求相关性可知,客户交易金额与客户的积分具有强相关性。在本文中,利用客户的积分来替换客户交易金额。由此,客户积分具有前一季积分总额、前四季积分总额、前八季积分总额三个属性。 因此,客户忠诚度模型表示为:L = T * N * I。其中,L表示忠诚度模型,T表示客户近期交易时间,N表示客户交易频率,I表示客户积分,“ * ”表示T、N、I三个属性之间相同的数据样本客户之间的聚集。 步骤四:均值RFM模型对客户分类传统的RFM模型分类是基于客户最近一次购买(R)、客户购买的频率(F)、客户购买的金额(M)三个属性来建模[15][16]。基于这三个属性,本文通过求出三个属性全部样本的平均值R—、F—、M—和每个属性中的每个样本Ri、Fi、Mi(i=1,2…62294)进行比较,大于均值的样本用1表示,小于均值的样本用0表示。 将客户分类定义为可保持、低价值、有潜力、要挽留四大类。 表表表表((((一一一一)))) 客户价值量分类表客户价值量分类表客户价值量分类表客户价值量分类表 第7页,共14页 步骤五:K-means RFM模型对客户分类根据客户最近一次购买(R)、客户购买的频率(F)、客户购买的金额(M)三个属性的所有样本值通过K-means(K=2)进行聚类,用聚类的方式求出样本之间的中心点,大于中心点的样本定义为1,小于中心点的样本定义为0。根据聚类后的样本进行分类(跟表(一)分类方法一样)。 步骤六:PCA RFM 模型对客户分类该方法突破传统 RFM 分类方式只用 R、F、M 三个属性进行建模的思想,结合 PCA(主成分分析)技术,通过步骤(3)筛选出来建立忠诚度的 3 类权衡属性:①客户近期交易时间②客户交易频率③客户积分,利用 PCA 降维的方法来构造新的 R、F、M 属性,分别求出①②③三大类属性的特征矩阵,并分别用①②③的最大特征值y1与①②③的协方差矩阵建立的 62294*1 的降维矩阵来代替传统的 R、F、M 属性。并结合步骤(四)和步骤(五)的方法,对样本进行分类。 2.3.结果分析结果分析结果分析结果分析 (1)通过对数据样本求均值的方法在客户级别上分类的分析: 通过图(1)、图(2)可知,基于均值求客户级别的方法,航空公司62294个数据样本中,潜在发展客户的人数最多,占百分比的32.26%。低价值客户居第二位,有19398个客户,占百分比的31.14%。而重要挽留客户人数为15267,占了总人数的24.51%。最后,一般保持客户、重要保持客户、重要发展客户和黄金客户人数分别有4083、1620、726、1100,分别占百分比7%、2.60%、1.17%和1.77%。 根据7种不同的级别分析,潜在发展客户最多,代表了该客户具有很高的潜力,最近刚开始乘坐该航空公司的飞机,但是其消费次数和消费金额还不高,是公司的新客户,具有一定的潜力发展价值。而低价值的客户也不少,超过了总人数的三成,对公司的贡献不大。在全部的客户中,有接近25%的客户在历史飞行记录中,飞行次数和消费金额都很可观,但是最近没有消费,有客户流失的危险,航空公司应该对该类型的用户进行挽留,多增加其优惠政策,从客户价值角度看,该用户对公司具有重要的价值。而一般保持客户具有低消费的特征,飞行次数比较多,属于散户短途飞行的类型。重要保持客户和重要发展客户占的人数不多,但重要发展客户具有很大的潜力,最有希望可以成为该航空公司的黄金客户,公司可通过“一对一”的营销服务提高与该客户的接触,这些客户将会给公司带来更大的利润,具有重要的发展潜力价值。最后,黄金客户占的比率虽然不高,但是其的忠诚度、飞行频率和交易金额都是最高的,对公司带来了丰厚的利润,无论从客户行为还是从客户价值,该客户都属于公司高利润的源泉,公司应该重点保持和培养这类型的客户。 (2)通过对数据样本求聚类的方法在客户级别上分类的分析