上海论文网提供毕业论文和发表论文,专业服务20年。

基于偏袒性集成学习的客户流失建模方法研究

  • 论文价格:免费
  • 用途: ---
  • 作者:上海论文网
  • 点击次数:179
  • 论文字数:0
  • 论文编号:el201210241000414771
  • 日期:2012-10-23
  • 来源:上海论文网
TAGS:

第2章相关理论概述


2.1客户关系管理理论概述
客户关系管理[1],可以理解为应用信息技术为企业提供全面的、个性化的客户资料,从而使客户与企业间所有的过程和互动能够有助于维系和拓展这种互利关系的一种商业战略。其核心思想来自市场营销理论,强调以客户为中心,通过完善的客户服务和深入的客户分析来满足客户的需求,不断提高客户的满意度和忠诚度,进而实现客户的终生价值。近年来,信息技术的发展使得CRM的实现成为可能。CRM将最佳的商业实践同数据库、数据仓库、OLAP技术、数据挖掘以及商务智能等信息技术紧密结合在一起,通过这些技术为企业提供关于客户信息的全面描述,并在此基础上利用恰当的模型和技术对客户群体进行细分,分析客户的购买行为,为企业的销售、客户服务和决策支持提供一个业务自动化的解决方案。
2.1.1客户关系管理的主要任务
从营销的观点来看,客户关系管理的主要任务包括以下几个方面:(1)客户细分:通常企业80%的利润是由20%的客户创造的(二八法则),考虑到企业资源的有限性,企业在采取营销策略的时候就必须区别对待这些客户,所以客户细分显得非常必要。在进行客户细分时,往往要收集关于客户的地理信息、人口统计信息(性别、年龄、收入等)、业余生活信息(兴趣、爱好等)、消费信息(目标利益、购买价值等)等,然后使用一定的聚合方法,将客户群划分为若干个子群。在此基础上,再对不同群体的客户采取不同的营销策略,以维系和吸引更多的客户。(2)客户忠诚度分析:所谓客户忠诚,是指客户对某一品牌、制造商、服务提供商以及其他经营主体的忠诚(如重复性购买)。通常影响客户忠诚的基础因素包括客户满意度、信任、情感纽带、习惯以及与公司的交易历史。企业应当对客户的购买行为进行全方位的分析,最终识别出企业的忠诚客户和非忠诚客户,并以此来预测公司客户的未来购买行为和趋势,以便采取相应的营销策略。
2.1.2客户关系管理的实施
实施基于数据挖掘技术的CRM是一个循序渐进、循环反复、不断调整的动态过程。其主要步骤如下:(1)确定分析和预测目标。在数据挖掘的过程中可能会发现很多有用的信息,确定挖掘目标是首要任务,然后才能产生初步的项目计划。值得注意的是,应用要达到的目标和数据挖掘的目标是不一样的,数据挖掘分析者需要根据自己的经验在二者之间进行转换。(2)数据选择。确定了业务目标后,要收集相关的数据,并对数据进行描述以熟悉数据,对数据进行检查以确定数据的质量。比如,从哪里获取数据、是否建立数据仓、是否可直接使用内部数据、哪些数据字段是有用的等等。通过数据选择可以对原始数据建立基本的可信度。在这一步骤中,如果遇到困难,则应返回到上一步重新对业务进行理解。


第3章汽车客户流失预测..................................26
3.1问题描述.................................26
3.2数据选择.................................26
3.2.1数据样本说明.................................26
3.2.2确定时间窗口.................................27
3.3数据分析和预处理.................................27
3.4建立模型.................................31
3.5模型评估和解释.................................35
3.6本章小结.................................39
第4章偏袒性集成学习.................................40
4.1引言.................................40
4.2偏袒性集成学习算法.................................40
4.3实验验证.................................4


第6章总结与展望


6.1本文的主要贡献和创新
本文主要以汽车客户流失项目为背景研究不平衡学习问题,将数据挖掘技术应用于客户关系管理中,提出了一种处理不平衡二分类问题的偏袒性集成方法,并针对不平衡三分类问题设计了两层分类结构。主要的创新点包括:
(1)偏袒性集成方法。该方法在数据抽样方面,采用有放回的随机抽取与正样本等量的负样本方法来平衡数据,然后用平衡的正负样本训练基分类器;在集成方法上,本文提出了偏袒性加权策略,在错误率相同的情况下集成能够突显那些对正样本识别能力更强的基分类器,从而使结果更加偏向于正样本。同时论文也给出了该算法的时间消耗讨论。
(2)两层分类结构。对于三分类的不平衡数据,本文设计了两层分类结构,在第一层将两类用户比较关注的小样本看作一类,从而分离出大类样本;在第二层再将相对平衡的两类小样本分类。从而将多分类不平衡问题分解为两次二分类问题,实验证明这种逐层剥离的方法非常有效。
(3)实际应用方面。本文对汽车客户销售维修数据进行了作了大量预处理工作,将繁杂的数据属性集成转换成五个特征属性和一个类标属性,从而将提出的偏袒性两层分类结构成功应用于汽车客户流失模型中,并取得了良好的效果。


参考文献
[4]Sollich P, Krogh A. Learning with ensembles: How over fitting can be useful. In: Touretzky D,MozerM, Hasselmo Meds.Adances in Neural information Processing Systems8, Cambridge, MA:MIT Press,1996.
[5]Hansen L K and Salamon P. Neural Network Ensembles. IEEE Transactions on Pattern Analysisand Machine Intelligence. 1990,12:993-1001.
[6]Schapire R E. The strength of weak learnability. Machine Learning, 1990,5(2):197-227.
[7]Breiman L. Bagging predictors.  Machine Learning. 1996,24(2):123-140.
[8]Bauer E. Kohavi R. An empirical comparison of voting classification algorithms: Bagging,boosting, and variants. Machine Learning. 1999,36:105-139.
[9]Hampshire J, Waibel A. A novel objective function for improved phoneme recognition usingtime delay neural networks. IEEE Transactions on Neural Networks. 1990, 1(2):216-228.
[10]Opitz D,Maclin R. Popular ensemble methods: An empirical study. Journal of ArtificialIntelligence Research. 1999,11:169-198.

1,点击按钮复制下方QQ号!!
2,打开QQ >> 添加好友/群
3,粘贴QQ,完成添加!!