预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共13页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

基于因子分析和聚类分析的客户偏好探究 一文献综述 二十世纪五十年代中期,美国学者温德尔史密斯提出了顾客细分理论。该理论指出,顾客由于其文化观念、收入、消费习俗等方面的不同可以分为不同的消费群体。企业在经营中应该针对不同的顾客提供针对性的服务,这样才能够利用有限资源进行有效的市场竞争。对顾客的细分从方法上讲有根据人口特征和购买历史的细分和根据顾客对企业的价值即基于顾客的消费金额、消费频率的细分。本文的细分是基于购买历史和人口特征的聚类分析。饭店作为一个古老的服务行业,在现阶段的高度竞争市场下的发展趋势最重要的方面便是服务趋于个性化,所以针对饭店的消费群体特征的聚类可以对饭店进行定位,在此基础上通过分析目标客户群体对消费质量评价的最主要影响因素可以达到其服务个性化的目标。波特把顾客的价值定义为买方感知性与购买成本的一种权衡。对顾客的个性化服务增加了买方的感知度从而加大了他们愿意为此付出的成本,于是饭店便可以增加营业额。 聚类分析是把研究对象视作多维空间中的许多点,并合理地分成若干类,即一种根据变量域之间的相似性而逐步归群成类的方法,它能客观地反映这些变量或区域之间的内在组合关系。李蓉,李宇.基与主成分分析与聚类分析方法的我国西部区域划分问题的研究.科技广场, 故聚类算法是对顾客进行分析的一个有效方式。在聚类分析的众多算法中因子分析是研究如何以最少的信息丢失,将众多原始变量浓缩成少数几个因子变量,以及如何使因子变量具有较强的可解释性的一种多元统计分析方法。李新蕊.主成分分析、因子分析、聚类分析的比较与应用.山东教育学院学报. 而典型的k-means算法以平方误差准则较好地实现了空间聚类,对于大数据集的处理效率较高。杨善林.kmeans算法中的k值优化问题研究系统工程理论与实践 在对顾客细分相关文献的研究过程中,主要运用的方法有神经网络,分层聚类,因子分析等方法。比如,在关于网络青少年用户的分类中,作者用层次聚类的方法,通过对青少年年龄,性别,民族,网络可得性,父母的观点等变量等变量定义不同的上网动机,在此基础上对其进行了分类。而在研究人寿保险持有者未来购买基金支持寿险可能性的文章中,通过灰度聚类和神经网络利用消费者的基本信息,财产地位信息,风险承受程度将消费者分为了忠实客户和非忠实客户。在对客户忠诚度的聚类中,作者用RFM的商业模型用DBI确定了Kmeans的最优K值,并最终用kmeans对客户忠诚度进行了聚类。 经过综合分析,我们选择了这两种方法处理顾客数据和饭店的基本资料。即,通过k-means对客户进行聚类后通过因子分析分析不同类别客户的评价影响因素。 为分析每类客户倾向的饭店特征,本文根据客户聚类结果对饭店数据进行筛选。由于饭店部分属性之间具有相关性,本文采用因子分析法挖掘其“根本属性”,之后对饭店数据进行聚类,分析得到每类客户评价得分最高的饭店特征。 二方法论 本文选取UCI上的数据(包括饭店、客户、评价得分等信息),旨在通过划分客户群体并分析每一类客户对不同饭店的评价得分,得出每一类顾客选择饭店的倾向,即特定类别客户的喜好和评价饭店时最看重的因素。将结论应用于指导饭店发展路线与目标客户群间的战略匹配。具体方法步骤如下: 1根据详细的客户信息对客户进行K-means聚类,总结出每一类客户的显著特点 2客户偏好的研究 饭店的多个属性之间存在相互影响的关系,因此本文在研究饭店特点采用因子分析法,将相同本质的属性归入一个因子,既可减少变量的数目,又能得出能够表征饭店属性的影响因子。 在因子分析的基础上,对同类顾客所评价的饭店进行聚类分析,得到每类顾客所选饭店的种类。然后分析比较各类饭店的特点,选出影响最大的因子(依据系数绝对值大小来判断),参照因子旋转矩阵后即可得到对顾客评分影响最大的饭店属性,从而分析出特定类别顾客在选择、评价一家饭店时的偏好。 FigureSEQFigure\*ARABIC1研究框架 三研究过程 顾客聚类分析: 在顾客信息的属性中删去UserID,其余属性作为输入字段进行K均值聚类。模型中的K值默认为5,但是分类结果中不同类型间的差异较小,随即降低K值进行尝试。考虑到顾客评分分为0,1,2三个等级,而且K=3时分类结果间的差异较显著,因此将顾客分为三类。 Cluster1:此类顾客人数最多,出生日期在1986年之后,绝大多数人学生,其次是工作者,主要同家人一起就餐;基本不饮酒;兴趣点主要为technology;绝大多数未婚,性格为thriftyprotectorCatholic为主;基本不吸烟;公交 Cluster2:此类顾客人数最少,年龄最大,不愿多透漏个人信息(数据中有大量缺失值)。 Cluster3:此类顾客人数居中,出生年份在1981左右,主要为学生、工作者多与朋友一起就餐,大多属于so