预览加载中,请您耐心等待几秒...
1/8
2/8
3/8
4/8
5/8
6/8
7/8
8/8

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN106547875A(43)申请公布日2017.03.29(21)申请号201610945406.6(22)申请日2016.11.02(71)申请人哈尔滨工程大学地址150001黑龙江省哈尔滨市南岗区南通大街145号哈尔滨工程大学科技处知识产权办公室(72)发明人邹晓梅杨静张健沛(51)Int.Cl.G06F17/30(2006.01)G06F17/27(2006.01)G06Q50/00(2012.01)权利要求书2页说明书4页附图1页(54)发明名称一种基于情感分析和标签的微博在线突发事件检测方法(57)摘要本发明属于网络检测领域,具体涉及一种基于情感分析和标签的微博在线突发事件检测方法。本发明包括:使用情感分类模型情感轮,构造情感分析模型——情感同现图;使用步骤(1)构造的情感分析模型,对微博流中的微博进行情感分类,采用kleinberg算法检测微博流的突发期;提取突发期内的微博标签,过滤掉垃圾标签,对剩余标签进行分词处理;形成事件的初始关键词;利用步骤(3)生成的关键词,提取微博中与此关键词相关的词,形成事件的最终描述。本发明构造基于情感轮的情感同现图,情感分类更加细致,情感更容易理解和解释,相对于基于情感符号的事件检测准确率更高。CN106547875ACN106547875A权利要求书1/2页1.一种基于情感分析和标签的微博在线突发事件检测方法,其特征在于,包括如下步骤:(1)使用情感分类模型情感轮,构造情感分析模型——情感同现图;(2)使用步骤(1)构造的情感分析模型,对微博流中的微博进行情感分类,采用kleinberg算法检测微博流的突发期;(3)提取突发期内的微博标签,过滤掉垃圾标签,对剩余标签进行分词处理;形成事件的初始关键词;(4)利用步骤(3)生成的关键词,提取微博中与此关键词相关的词,形成事件的最终描述。2.根据权利要求1所述的一种基于情感分析和标签的微博在线突发事件检测方法,其特征在于,所述步骤(1)中,通过如下方法构造情感同现图:(1.1)使用情感轮模型,人工对情感符号赋予合理的词汇;(1.2)对原始微博数据进行分词处理,形成微博语料库;(1.3)使用HowNet词典,采用基于距离的词语相似性计算微博语料库词语和情感符号词语之间的相似度;(1.3)中使用如下公式计算词语检测的相似性:式中W1和W2代表词语,词语W1有k个义项:{n11,n12,…,n1k},词语W2有p个义项:{n21,n22,…,n2p},p1和p2表示两个义原,d是p1和p2在义原层次体系中的路径长度,是一个正整数;α是一个可调节的参数;(1.4)建立相似度大于给定阈值λ的词语之间的连接,完成情感同现图的构造;λ选择0.6。3.根据权利要求1所述的一种基于情感分析和标签的微博在线突发事件检测方法,其特征在于,所述的步骤(3)中,包含以下步骤:(3.1)对提取的标签进行词性标注,去掉只有动词的标签或者只有一个名词的标签;(3.2)剔除掉标签中含有特殊符号的标签;(3.3)剔除掉含有标准日期格式、只有数字和标点符号的标签。4.根据权利要求1所述的一种基于情感分析和标签的微博在线突发事件检测方法,其特征在于,所述的步骤(4)中包括以下步骤:(4.1)对突发期内剩余标签进行分词处理;(4.2)计算突发期内有关微博标签关键词的频繁模式;(4.3)提取频繁模式中的2项集,计算该2项集中词语之间的互信息;(4.4)保留互信息大于给定阈值γ的词形成最终的事件描述;γ的值选择1.5;步骤4.4中互信息计算公式为:2CN106547875A权利要求书2/2页C(W1)和C(W2)分别表示语料库中含有W1和W2的微博数量,C(W1,W2)表示同时含有W1和W2的微博数量;R为语料库的规模,即微博总数。3CN106547875A说明书1/4页一种基于情感分析和标签的微博在线突发事件检测方法技术领域[0001]本发明属于网络检测领域,具体涉及一种基于情感分析和标签的微博在线突发事件检测方法。背景技术[0002]近年来随着Web2.0技术蓬勃发展,涌现出一系列社交网络。这些社交网络如新浪微博、推特等吸引着大量的用户。用户们活跃在在社交网络上,发布大量的微博消息,其中包含着有关某些事件的看法或观点。通过挖掘这些微博消息,可以得到大量的如用户情感等的更深层次的信息。使用这些深层次的信息可以为政府或企业提供服务,例如,政府可以使用这些信息判断人们对法律法案是否支持,对某一社会事件持有什么样的看法,从而进行舆情控制和引导;企业可以通过挖掘用户的微博消息,得知用户的行为习惯和偏好,从而向其推荐用户最有可能感兴趣或购买的商品。[0003]对于突发事件检测,传统方法有两种,即基于文档的突发事