您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。 [TIPDM]:第一届挑战赛A1-航空客运的客户细分研究 - 发现报告

第一届挑战赛A1-航空客运的客户细分研究

2013-04-22 TIPDM 静心悟动
报告封面

题目航空客运的客户细分研究队长陈健林成员肖宇,吴晓声学校(院系)华南师范大学物理与电信工程学院指导教师薛云完成时间2013 年 4 月 20 号 综合评定成绩综合评定成绩综合评定成绩综合评定成绩:::: 评委评语评委评语评委评语评委评语:::: 评委签名评委签名评委签名评委签名:::: 航空客运的客户细分研究航空客运的客户细分研究航空客运的客户细分研究航空客运的客户细分研究 摘摘摘摘要要要要::::近年来,客户关系管理(CRM)在金融、电信、电子商务等许多行业内受到了越来越高的重视。而对 CRM 中任何领域的研究必需条件就是对客户进行分类,从而对不同类型的客户分别采用不同的管理策略。当前的客户关系管理主要基于 RFM(Recency FrequencyMonetary)模型用数据挖掘技术中的聚类方法对客户细分,但是,第一方面,该方法只选择客户属性中的 R(最近一次消费)、F(消费频率) 、M(消费金额)这 3 个属性对客户进行分类,而客户的消费行为的影响因素是多样的,所以该方法只能对客户进行价值分类,并不能根据价值以外的客户消费特征比如行为特征进行更精确和细致的分类;第二方面,使用传统的聚类方法只能对全局特征相似的客户群体进行分类,并不能有效对局部特征相似的客户群体进行分类。针对以上问题,本文基于卡方统计量和关联规则提出了一种高效的双聚类方法,该方法基于卡方统计量得到多个有分析意义的属性集,进而基于密度的 DBSCAN 算法进行群体聚类,将客户大体上分为高,中,低三等,最后分别由算法进行客户行为特征聚类。该算法使用实际的某航空会员数据进行实验,实验表明,本文提出的双聚类算法的结果能够精确和细致的对航空会员进行分类,并挖掘和分析其中的信息提出相应的营销策略。 关键词关键词关键词关键词::::客户细分;数据挖掘;属性选择;DBSCAN;FP-growth;apriori;双聚类 The research ofThe research ofThe research ofThe research of Air passenger CustomerAir passenger CustomerAir passenger CustomerAir passenger CustomerSegmentatioSegmentatioSegmentatioSegmentationnnn Abstract:Abstract:Abstract:Abstract:In recent years, customer relationship management (CRM) in many industriessuch as finance, telecommunications, e-commerce has been taken more and moreattentions. Necessary conditions on any field in the CRM is the customerclassification, using different management strategies for different types ofcustomers. Currently customer relationship management is mainly based on RFM (RecencyFrequency Monetary) model with clustering method of customer segmentation in datamining technology, however, firstly, the method to select only customer attributesin R (a consumer), F (frequency of consumption), M (spend) the three attributes ofcustomer classification, since the influencing factors of customer behavior isdiverse, the method only for the customers value, and not according to customers otherthan the value of consumption features such as the behavioral characteristics of moreaccurate and detailed classification; Secondly, using traditional clustering methodcan classify similar customer groups with the only global features while can not findcategorize similar customer groups with effective local features. To solve the aboveproblem, this paper based on the chi-square statistic and association rules anefficient dual clustering method, the method based on the chi-square statisticanalysis set of attributes, and then DBSCAN algorithm based on density polyethylenegroups class customers generally divided into high, medium and low third-class, andfinally by the feature clustering algorithm customer behavior. The algorithm usesan aviation actual member data experiments show that the results of the of dualclustering algorithm proposed in this paper can be accurate and detailed to classifythe aviation members, and can mine and analyze information to propose appropriatemarketing strategies. Key words:Key words:Key words:Key words:Customer segmentation; Data mining; Attribute selection; DBSCAN;FP-growth;apriori; Biclustering 目录 1.挖掘目标挖掘目标挖掘目标挖掘目标........................................................................................... 62.分析方法与过程分析方法与过程分析方法与过程分析方法与过程................................................................................ 62.1.总体流程..................................................................................................................... 62.2.具体步骤..................................................................................................................... 7•步骤一:数据预处理.............................................................................................. 7•步骤二:群体聚类.................................................................................................. 9•步骤三:行为特征聚类........................................................................................ 152.3.结果分析................................................................................................................... 17•第一类:................................................................................................................ 17•第二类:................................................................................................................ 18•第三类:................................................................................................................ 193.结论结论结论结论.................................................................................................204.参考文献参考文献参考文献参考文献..........................................................................................20 1.挖掘挖掘挖掘挖掘目标目标目标目标 本次建模目标是在航空公司的海量会员数据中选择符合此研究方向的评价基础属性并分析与各属性之间的相关性,从而发现并选择相关属性集;构建反映客户价值评价指标体系,聚类出行为特征一致的客户,从而可对具有特定行为特征的群体进行相应的营销策略 2.分析方法与过程分析方法与过程分析方法与过程分析方法与过程 2.1.总体流程总体流程总体流程总体流程 主要包括如下步骤: 步骤一:数据预处理,根据经营策略选择评价属性,对所有属性与评价属性之间进行相关性分析,去除属性集中的弱相关项与冗余项从而达到数据简化的目的。 步骤二:群体聚类,用K-means 算法将每个属性的原始数据划分为三个级别(1,2,3),再由基于密度可达的 DBSCAN 算法进行客户聚类,将所有客户大体上分为高,中,低三个等级 第6页,共20页步骤三:行为特征聚类,用双聚类分别对步骤二的三个等级的聚类结果分别做行为特征 聚类,采用基于了基于 apriori 的双聚类和 FP-growth 的双聚类。 步骤四:结果分析,挖掘最终聚类结果中的信息并提出相应的营销策略。 2.2.具体步骤具体步骤具体步骤具体步骤 •步骤步