预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共11页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

第12卷第2期管理科学学报Vol.12No.2 2009年4月JOURNALOFMANAGEMENTSCIENCESINCHINAApr.2009 中文网络客户评论的产品特征挖掘方法研究① 李实1,叶强1,2,李一军1,RobLaw2 (1.哈尔滨工业大学管理学院,哈尔滨150001;2.香港理工大学,中国香港100085) 摘要:随着互联网的广泛应用,在Blog、BBS、Wiki等网络站点中出现了大量的针对商品或服 务的客户评论,这些客户评论中所包含的丰富信息,对企业管理具有重要的价值.通过数据挖 掘算法对客户针对某一产品的大量评论进行分析,可以挖掘出这些产品的主要特征,并有望进 一步发现客户对这些特征的意见和态度.在英文世界中已经有学者开始对这一研究进行探索, 然而由于语言结构等方面的差异,英文的研究成果尚无法直接应用于中文客户评论的挖掘中. 本研究针对中文的特点,提出了面向中文的客户评论挖掘方法.该方法基于改进关联规则算法 实现了针对中文产品评论的产品特征信息挖掘.本研究采用通过互联网获得的针对手机、数码 相机、书籍等5种产品的评论语料,对该方法进行了数据实验,实验结果初步验证了该方法有 效性. 关键词:用户评论;产品特征;关联规则;数据挖掘 中图分类号:TP311文献标识码:A文章编号:1007-9807(2009)02-0142-11 0引言户评论信息为目标的非结构化数据分析技术——— “评论挖掘”吸引了很多学者关注[4].评论挖掘作 过去十几年中,Internet技术与应用的快速发为非结构化信息挖掘的一个新兴领域,主要涉及 展不仅给企业的业务流程带来了巨大的变革,也网络评论情感倾向的分析,评论中产品特征的提 ~ 对消费者的行为模式产生了深刻的影响.一方面取,以及评论中产品比较信息挖掘等等[58].消 改变了消费者表达对于产品观点和看法的方费者可以借助于评论挖掘工具了解产品的性能和 式———他们可以在销售网站,网络论坛,讨论小其他用户对该产品的态度;同时,网络客户评论作 组以及博客中撰写产品评论另一方面这 ,(Blog);为反馈机制,可以为销售商和生产商提供哪些产 些产品的“口碑”也反过来影响其他消费者做出 品特征是客户所关注的以及客户对于产品的情感 购买决策[1,2].DoubleClickInc.进行了针对美国 倾向分布等信息,从而可以帮助企业改进产品、改 服装业、计算机硬件设备业、运动健身产品行业及 善服务,获得竞争优势.面向网络用户评论的产品 旅游业网络客户的研究[3],发现这些行业中,近 特征提取研究,作为评论挖掘的研究方向之一,旨 一半以上的互联网用户做出购买决定前,会在互 在从客户评论中挖掘出备受关注的产品特征信 联网上搜索有关产品介绍及商品评论等信息. 息并且总结基于这些产品特征的观点依靠情感 但是,随着网络评论数量的飞速增长,庞杂的,, 信息使得人工方法难以获得全部客户评论中的有分类(sentimentclassification)技术自动得出用户 用信息.因此,迫切需要借助一定的技术手段来使对各个属性的态度倾向,从而可以为用户提供更 [9] 这一过程变得更为便捷.近来,以有效获取网络用为具体和有价值的信息.在英文世界的评论挖 ①收稿日期:2007-11-23;修订日期:2008—04—25. 基金项目:国家自然科学基金资助项目(70771032,70501009);香港理工大学研究基金资助项目(G-YX93). 作者简介:李实(1976—),女,黑龙江哈尔滨人,博士生.Email:shishili@gmail.com ©1994-2010ChinaAcademicJournalElectronicPublishingHouse.Allrightsreserved.http://www.cnki.net 第2期李实等:中文网络客户评论的产品特征挖掘方法研究—143— 掘领域,研究者已经初步取得一些成果,而针对中1)挖掘重要产品特征;2)挖掘用户对于产品特征 文网络用户评论的研究还处于起步阶段.随着我的主观观点;3)判断评论观点的情感导向;4)根 国网络用户群的不断壮大,中国电子商务的发展据观点的重要性进行排名.相关研究包括评论的 [6][14] 也逐渐为世界所瞩目.截至2007年12月,中国网情感分析,评论的主客观分析以及评论中商 [4,5,9] 民人数已经达到2.1亿,预计2008年将超过美国品特征挖掘等. 成为世界第一[10].不断增长的中文评论已经成为1.1网络客户评论情感分析 互联网上一个重要的组成部分,为了给企业和个情感分析以客户在互联网上发布的产品评论 人提供更为方便的工具,自动化和智能化地挖掘为研究对象,挖掘客户的情感倾向,从而自动判断 中文评论中的有价值信息是非常必