摘要 本文重点讨论了聚类分析方法中K-means聚类算法在客户价值分析中的作用,通过对客户的现有价值和潜在价值进行分析,对客户进行细分。在此基础上,企业可结合行业的特征找出各类客户的特点,实行差异化服务策略,让更好的资源和服务提供给最有价值客户,从而达到顾客满意、企业盈利的目的。
关键词 聚类分析 K-means聚类算法 客户价值
1 引言
市场分析理论认为,20%的客户带来约80%的利润,即帕累托所谓“关键的少数与次要的多数”的关于市场分布的一般规律[1]。通常情况下,只有少部分高价值的客户才能够为企业带来大部分利润。进行客户细分后,企业可以为高价值客户提供足够的技术和人力试粗С郑猿浞致闫涠云笠悼突Х竦钠谕O喾矗俨糠值图壑档目突в惺焙蛏踔粱岣笠荡锤豪蟆6蠖嗍突г虼τ诟呒壑涤氲图壑抵屑洌瞧笠抵匾目突海ǔ;岫云笠档牟莆褚导ú艽蟮挠跋臁R环矫妫腔岽锤嗟目突Х⒄够幔涣硪环矫妫且不嵬贝春芨叩脑擞缦铡6云笠道唇玻呒壑悼突峁┯胖实姆窈苤匾煌忝娴目突峁┫嘤Φ挠姓攵孕缘姆褚餐匾?lt;/DIV>
作为数据挖掘技术中的一种重要的方法,聚类分析可以用于大量客户群细分。按不同特征将客户分群后,就可以为每一群开发独立的预测模型,并根据每一群的不同特点进行分析,从而提供差异化服务或产品。常见的聚类分析算法主要有以下三类:
(1)划分法:给定一个有N个(K<N)元组或者记录的数据集,构造K个分组,每一个分组就代表一个聚类。对于给定的K,算法首先给出一个初始的分组方法,以后通过反复迭代的方法改变分组,使得每一次改进之后的分组方案都较前一次好。使用该基本思想的算法有K-means算法、K-medoids算法和CLARANS算法。
(2)层次法:对给定的数据集进行层次似的分解,直到某种条件满足为止。具体又可分为“自底向上”和“自顶向下”两种方案。代表算法有BIRCH算法、CURE算法以及CHAMELEON算法等。
(3)基于密度的方法:基本思想就是:只要一个区域中的点的密度大过某个阀值,就把它加到与之相近的聚类中去,以克服基于距离的算法只能发现“类圆形”聚类的缺点。
客户价值作为客户细分的关键变量,传统的市场营销或CRM方案通常按客户过去或现在对企业的利润水平细分客户,把客户划分为高赢利客户、一般赢利客户和不赢利客户,以此为基础为不同类型的客户设计相应的产品或营销方案。在客户需求瞬息万变的今天,这种战略容易忽视对潜在客户和成长性客户之间关系的构建和管理,从而影响企业长期的发展。客户价值研究给企业的启示是,客户细分不仅要考虑客户当前的利润贡献,更要考虑客户的生命周期价值;也就是说既要考虑到客户的现有价值,也要考虑到客户的潜在价值。本文将应用K-means聚类算法对客户的现有价值和潜在价值进行客户的分类。
2 K-means聚类算法思想及基本步骤
K-means聚类的核心思想如下:算法把n个向量xj(j=1,2…,n)分为c个组Gi(i=1,2,…,c),并求每组的聚类中心,使得非相似性(或距离)指标的价值函数(或目标函数)达到最小。当选择欧几里德距离为组j中向量xk与相应聚类中心ci间的非相似性指标时,价值函数可定义为:



下面给出数据集xi(1,2…,n)的K-means算法的基本步骤。该算法重复使用下列步骤,确定聚类中心ci和隶属矩阵U:
步骤1:初始化聚类中心ci,i=1,…,c。典型的做法是从所有数据点中任取c个点。
步骤2:用式(3)确定隶属矩阵U。
步骤3:根据式(1)计算价值函数。如果它小于某个确定的阀值,或它相对上次价值函数值的改变量小于某个阀值,则算法停止。
步骤4:根据式(4)修正聚类中心。返回步骤2。
该算法本身是迭代的,且不能确保它收敛于最优解。K-means算法的性能依赖于聚类中心的初始位置。所以,为了使它可取,要么用一些前端方法求好的初始聚类中心;要么每次用不同的初始聚类中心,将该算法运行多次。此外,上述算法仅仅是一种具有代表性的方法;还可以先初始化一个任意的隶属矩阵,然后再执行迭代过程。
3 K-means聚类算法在客户价值分析中的应用
3.1 算法描述
本文所用的K-means算法,其聚类的数量k是在算法运行前确定的(这是很多聚类算法的典型情况),先从样本中随机捡取k个聚类中心,再根据欧氏距离把每个点分配到最接近其均值的聚类中,然后计算被分配到每个聚类的点的均值向量,并作为新的中心进行递归。具体的算法是这样的:假定数据点D={X1…….Xn},任务是找到k个聚类{C1……Ck}:
基于K-means聚类算法的客户价值由800论文网收集整理,转载请注明出处!
基于K-means聚类算法的客户价值由800论文网收集整理,转载请注明出处!
- 上一篇:对Verilog HDL的优化
- 下一篇:主体数据平台
相关论文
- 主体数据平台
- 基于K-means聚类算法的客户价值
- 对Verilog HDL的优化
- WIN的操作系统密码解决方案
- 椭圆曲线的数据加密通信
- Hopfield神经网络的识别
- MVC模式的Struts框架在会计中的应用
- 针对全景图的虚拟现实的研究
最新论文
- 主体数据平台
- 基于K-means聚类算法的客户价值
- 对Verilog HDL的优化
- WIN的操作系统密码解决方案
- 椭圆曲线的数据加密通信
- Hopfield神经网络的识别
- MVC模式的Struts框架在会计中的应用
- 针对全景图的虚拟现实的研究
- 曲面重构的方法的研究
- 4G网络通信的主要技术
- 石化行业的信息采集系统
- 基于角色的分级管理在电子政务中的应用研究
- 面向对象系统分析阶段软件复用模型研究
- 基于互联网的信息检索系统的建立
- 管理信息系统的建立
- 信息工程监理
- 数字档案管的建设中存在的问题
- 互联网对会计实物的影响
- 互联网对会计理论的促进
- 讨论多媒体的设计
- 网络技术的现状
- SOC单片机的应用
- Home.net的架构
- 硬件语言的描述
- 对计算机犯罪的研究
推荐论文

