预览加载中,请您耐心等待几秒...
1/6
2/6
3/6
4/6
5/6
6/6

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN115080734A(43)申请公布日2022.09.20(21)申请号202210477596.9(22)申请日2022.04.29(71)申请人石燕青地址210095江苏省南京市玄武区卫岗1号南京农业大学(72)发明人石燕青(51)Int.Cl.G06F16/35(2019.01)G06K9/62(2022.01)G06N20/00(2019.01)权利要求书1页说明书3页附图1页(54)发明名称一种基于注意力机制与强化学习的跨域情感分类方法(57)摘要为解决不同领域标记数据缺失下的情感分类的问题,本发明提出了一种基于注意力机制与强化学习的跨域情感分类方法。首先,针对源域标记数据以及目标域无标记数据进行预处理,随后训练大规模语言模型BERT,并借助于注意力机制进行数据项中情感特征的提取。接着,基于强化学习思路应用随机策略进行特征选择,并根据计算得到的延迟奖励进行策略优化。最终,使用最优的情感分类策略实现跨域情感分类。本发明提升了源域中标记数据的使用率,并有效实现了跨域情感分类,减少了人工标记的成本。CN115080734ACN115080734A权利要求书1/1页1.一种基于注意力机制与强化学习的跨域情感分类方法,其特征在于,包括以下步骤:步骤一,数据预处理,针对不同领域数据进行分词,词向量转换等预处理,预处理后数据用于下一阶段特征提取模型训练。步骤二,特征提取模型训练,使用预处理后的源域标记数据对BERT模型进行训练,并获取文本向量集合,随后经过注意力机制层处理,根据得到的数据项中单词的注意力系数筛选出情感特征。步骤三,基于强化学习的特征选择策略训练,基于强化学习的思想,进行特征选择,并根据延迟奖励进行策略优化最终得到最优的跨域情感分类策略。步骤四,跨域数据情感分类,基于最优的跨域情感分类策略,针对目标域数据项进行情感极性的识别,最终实现情感分类。2.根据权利要求1所述的基于注意力机制与强化学习的跨域情感分类方法,其特征在于,所述步骤一具体为:针对不同领域数据进行分词,词向量转换等预处理,预处理后的源域数据用于下一阶段特征提取模型训练,目标域数据用于最终强化学习策略的情感极性识别。3.根据权利要求1所述的基于注意力机制与强化学习的跨域情感分类方法,其特征在于,所述步骤二具体为:特征提取模型训练,使用预处理后的源域标记数据对BERT模型进行训练,得到数据项的向量表示:xi=[BERTwi],(1)其中,wi表示输入数据项中第i个单词。随后输入至注意力机制层得到单词的特征表示。hi=tanh(Wixi+bi),(2)r={fea1,...,feai,...,fean},(4)其中Wi代表权重矩阵,bi代表网络学习偏差,ai代表句子中单词的注意力值,特征注意力系数为feai=ai*hi,我们根据最终计算得到的特征注意力系数值筛选出句子中的情感特征。4.根据权利要求1所述的基于注意力机制与强化学习的跨域情感分类方法,其特征在于,所述步骤三具体为:基于强化学习的特征选择策略训练,基于强化学习的思想,进行特征选择,最初使用随机策略选择句子中的情感特征,随后计算延迟奖励进行策略优化最终得到最优的跨域情感分类策略。5.根据权利要求1所述的基于强化学习的跨域情感分类方法,其特征在于,所述步骤四具体为:跨域数据情感分类,基于最优的跨域情感分类策略,针对目标域数据项进行情感极性的识别,最终实现情感分类。P(y|X)=SoftmaX(CF+b).(5)其中F是情感特征表示。C是权重矩阵,b是连接层的偏置。计算得到概率最高的情感极性代表该数据项最终的情感分类。2CN115080734A说明书1/3页一种基于注意力机制与强化学习的跨域情感分类方法技术领域[0001]本发明涉及自然语言处理领域的情感分类问题,涉及一种基于注意力机制与强化学习的跨域情感分类方法。背景技术[0002]监督学习是一种应用广泛的机器学习方法,通过带标记的数据进行模型训练,从而获取标记数据中的先验知识,这种方法与大规模语言模型的结合被有效地应用在自然语言处理任务之中。这种方法需要足够的标记数据来训练语言模型。然而,实际上,在不同的领域中并不容易发掘大量的标记数据。人工数据标注需要消耗大量的人力。如何在目标领域数据缺失标记数据情况下,有效地应用带有标记的源域数据来实现目标领域的情感分类是一个亟待解决的问题。[0003]随着深度学习的发展,越来越多的深度学习方法被应用在跨域的数据情感分类任务上,大规模深度语言模型BERT的提出,有效实现了上下文语言信息的挖掘,进一步提升了自然语言中信息处理的性能。注意力机制可以有效的挖掘文本中的重点信息,借助于该方法可以进行重点情感信息的提取。同时随着强化学习的不断发展,强化学习思想已