预览加载中,请您耐心等待几秒...
1/6
2/6
3/6
4/6
5/6
6/6

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

研究与开发 文章编号:1007-1423(2013)07-0011-06DOI:10.3969/j.issn.1007-1423.2013.07.003 面向产品评论的意见挖掘研究综述 李俊 (四川大学计算机学院,成都610065) 摘要:近年来,随着电子商务的快速发展,面向产品评论的意见挖掘研究受到国内外学者的广泛 关注,成为学术界的研究热点之一。对产品评论进行意见挖掘,不仅能为用户购物提供决策 支持,还可以帮助生产商对产品和服务进行改进,具有重要的研究意义。对面向产品评论的 意见挖掘的研究现状进行归纳和总结。首先将该问题分为3个子任务:意见信息抽取、情感 分析,意见归纳。然后基于国内外的研究进展对它们进行详细的介绍和分析,并讨论该领域 其他一些值得关注的问题。 关键词:产品评论;意见挖掘;情感分析;信息抽取 0引言意见挖掘,又称为情感分析,是指对带有情感色彩 的主观性文本进行分析、处理、归纳和推理的过程[1],而 近年来,随着以用户为中心的Web2.0技术的快速 针对产品评论的意见挖掘一直是意见挖掘领域的热 发展和应用的不断扩展,人们可以通过微博、博客、论 点。文献[2]认为,意见是意见持有者针对某个实体或实 坛、电子商务网站等多种途径发表自己的对于某件产 体某个方面的正面或者负面的观点、态度、情感或者评 品或服务的意见或观点,这些评论信息中包含了用户 价,其中意见的表达对象可以是任何事物,例如产品、 对产品或服务的描述、评价和态度,具有重要的价值。 服务、事件、主题等,意见的持有者可以是个人或组织。 通过浏览这些评论,消费者在购买产品之前可以从购 在本章中,我们将利用来自Amazon.cn的一段关于笔 买过该产品的用户那里了解到该产品的性能和质量, 记本电脑的评论来进一步阐述意见挖掘这个问题。 还可以对同类产品进行对比,从而决定是否购买该产 “(1)十一月底打特价买的这个本。(2)开箱封条是 品。同时,生产商通过消费者对目前产品的评价,可以 完整的,货运保护措施也很到位。(3)可是本本后面几 了解到自己产品的优势和不足,把握用户的需求,从而 颗螺丝有非常明显的划痕,还有屏幕上有几条划痕。 不断地改进产品,改善服务。 (4)就这台电脑本身来说,这样的配置目前3199的价 由于网络上的产品评论数量呈爆炸式增长,通过 格应该是挺难得了。” 人工的方式去阅读、分析和处理这些评论信息是一件 其中,句子(1)是客观性文本。句子(2)、(4)表达了 非常耗时的任务。因此,迫切的需要提供一种有效的方 正面的意见,而句子(3)表达了负面的意见。更深入一 法,自动或半自动地从大量非结构化的产品评论中挖 些,我们注意到所有的评价意见都有一个关联评价对 掘出有价值的信息。在这一背景下,面向产品评论的意 象。句子(2)的评价对象是“封条”和“货运保护措施”, 见挖掘的研究应运而生。 且隐含表达了对“产品包装”的正面评价,句子(3)的评 1问题定义价对象是“螺丝”和“屏幕”。句子(4)的评价对象是“配 收稿日期:2013-01-29修稿日期:2013-03-01 作者简介:李俊(1987-),男,广西贺州人,硕士研究生,研究方向为数据挖掘与自然语言学 现代计算机2013.03上趤趮 研究与开发 置”。这些观点和意见的持有者是该产品的购买者。针于依赖名词短语识别技术的准确性,不利于跨领域或 对以上信息,我们可以更正式地提出意见挖掘的任务:跨语言的应用。 ●任务1:意见信息抽取。指提取评论文本中的评由于评价对象可认为蕴含于评论语料中某个特定 价对象、评价词、评价者等意见组成要素,旨在将自然的主题,近年来,许多学者将主题模型[10]应用到意见挖 文本转化成结构化文本。掘领域。文献[11]使用多粒度的LDA模型获取产品特 ●任务2:情感分类。判断文本的主客观性,或者征,并将相似的产品特征进行聚类到同一主题。研究 判断文本的情感极性(褒义、贬义、中性)。者[12]将评论中每一个句子属于一个主题和一种情感, ●任务3:意见摘要。在意见信息抽取和情感分类基于LDA模型提出SLDA模型来获取产品特征。实验 结果的基础上,进一步加工处理,生成一个对实体的评证明,此类方法在产品特征抽取中能够取得一定的效 价归总。果,但是此方法需要预先定义主题的个数,且目前还没 国内外学者对该课题进行了广泛而深入的研有实验将这类方法与传统的基于名词和名词短语的方 究[3~4]。本文在接下来的部分将详细阐述意见挖掘的3法进行对比。 个主要研究任务,主要介绍关于产品评论的意见挖掘2.2评价词抽取 研究的主流方法和前沿进展。评价词(Opinion/Opinion-BearingWords),也常被称 为情感词指评价者对评价对象表达 2意见信息抽取(OpinionE