一种基于注意力机制与强化学习的跨域情感分类方法-豆柴文库

一种基于注意力机制与强化学习的跨域情感分类方法.pdf

2023-07-21

10金币

288KB

6页

甲申****66

实名认证

内容提供者

1/6

2/6

3/6

4/6

5/6

6/6

在线预览结束，喜欢就下载吧，查找使用更方便

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN115080734A(43)申请公布日2022.09.20(21)申请号202210477596.9(22)申请日2022.04.29(71)申请人石燕青地址210095江苏省南京市玄武区卫岗1号南京农业大学(72)发明人石燕青(51)Int.Cl.G06F16/35(2019.01)G06K9/62(2022.01)G06N20/00(2019.01)权利要求书1页说明书3页附图1页(54)发明名称一种基于注意力机制与强化学习的跨域情感分类方法(57)摘要为解决不同领域标记数据缺失下的情感分类的问题，本发明提出了一种基于注意力机制与强化学习的跨域情感分类方法。首先，针对源域标记数据以及目标域无标记数据进行预处理，随后训练大规模语言模型BERT，并借助于注意力机制进行数据项中情感特征的提取。接着，基于强化学习思路应用随机策略进行特征选择，并根据计算得到的延迟奖励进行策略优化。最终，使用最优的情感分类策略实现跨域情感分类。本发明提升了源域中标记数据的使用率，并有效实现了跨域情感分类，减少了人工标记的成本。CN115080734ACN115080734A权利要求书1/1页1.一种基于注意力机制与强化学习的跨域情感分类方法，其特征在于，包括以下步骤：步骤一，数据预处理，针对不同领域数据进行分词，词向量转换等预处理，预处理后数据用于下一阶段特征提取模型训练。步骤二，特征提取模型训练，使用预处理后的源域标记数据对BERT模型进行训练，并获取文本向量集合，随后经过注意力机制层处理，根据得到的数据项中单词的注意力系数筛选出情感特征。步骤三，基于强化学习的特征选择策略训练，基于强化学习的思想，进行特征选择，并根据延迟奖励进行策略优化最终得到最优的跨域情感分类策略。步骤四，跨域数据情感分类，基于最优的跨域情感分类策略，针对目标域数据项进行情感极性的识别，最终实现情感分类。2.根据权利要求1所述的基于注意力机制与强化学习的跨域情感分类方法，其特征在于，所述步骤一具体为：针对不同领域数据进行分词，词向量转换等预处理，预处理后的源域数据用于下一阶段特征提取模型训练，目标域数据用于最终强化学习策略的情感极性识别。3.根据权利要求1所述的基于注意力机制与强化学习的跨域情感分类方法，其特征在于，所述步骤二具体为：特征提取模型训练，使用预处理后的源域标记数据对BERT模型进行训练，得到数据项的向量表示：xi＝[BERTwi]，(1)其中，wi表示输入数据项中第i个单词。随后输入至注意力机制层得到单词的特征表示。hi＝tanh(Wixi+bi)，(2)r＝{fea1，...，feai，...，fean}，(4)其中Wi代表权重矩阵，bi代表网络学习偏差，ai代表句子中单词的注意力值，特征注意力系数为feai＝ai*hi，我们根据最终计算得到的特征注意力系数值筛选出句子中的情感特征。4.根据权利要求1所述的基于注意力机制与强化学习的跨域情感分类方法，其特征在于，所述步骤三具体为：基于强化学习的特征选择策略训练，基于强化学习的思想，进行特征选择，最初使用随机策略选择句子中的情感特征，随后计算延迟奖励进行策略优化最终得到最优的跨域情感分类策略。5.根据权利要求1所述的基于强化学习的跨域情感分类方法，其特征在于，所述步骤四具体为：跨域数据情感分类，基于最优的跨域情感分类策略，针对目标域数据项进行情感极性的识别，最终实现情感分类。P(y|X)＝SoftmaX(CF+b).(5)其中F是情感特征表示。C是权重矩阵，b是连接层的偏置。计算得到概率最高的情感极性代表该数据项最终的情感分类。2CN115080734A说明书1/3页一种基于注意力机制与强化学习的跨域情感分类方法技术领域[0001]本发明涉及自然语言处理领域的情感分类问题，涉及一种基于注意力机制与强化学习的跨域情感分类方法。背景技术[0002]监督学习是一种应用广泛的机器学习方法，通过带标记的数据进行模型训练，从而获取标记数据中的先验知识，这种方法与大规模语言模型的结合被有效地应用在自然语言处理任务之中。这种方法需要足够的标记数据来训练语言模型。然而，实际上，在不同的领域中并不容易发掘大量的标记数据。人工数据标注需要消耗大量的人力。如何在目标领域数据缺失标记数据情况下，有效地应用带有标记的源域数据来实现目标领域的情感分类是一个亟待解决的问题。[0003]随着深度学习的发展，越来越多的深度学习方法被应用在跨域的数据情感分类任务上，大规模深度语言模型BERT的提出，有效实现了上下文语言信息的挖掘，进一步提升了自然语言中信息处理的性能。注意力机制可以有效的挖掘文本中的重点信息，借助于该方法可以进行重点情感信息的提取。同时随着强化学习的不断发展，强化学习思想已

相关资料

一种基于注意力机制与强化学习的跨域情感分类方法.pdf

为解决不同领域标记数据缺失下的情感分类的问题，本发明提出了一种基于注意力机制与强化学习的跨域情感分类方法。首先，针对源域标记数据以及目标域无标记数据进行预处理，随后训练大规模语言模型BERT，并借助于注意力机制进行数据项中情感特征的提取。接着，基于强化学习思路应用随机策略进行特征选择，并根据计算得到的延迟奖励进行策略优化。最终，使用最优的情感分类策略实现跨域情感分类。本发明提升了源域中标记数据的使用率，并有效实现了跨域情感分类，减少了人工标记的成本。

2023-07-21

288KB

一种基于ALBERT和LDA的跨域情感分类方法.pdf

本发明公开了一种基于ALBERT和LDA的跨域情感分类方法，首先进行模型训练与数据的预处理，使用训练数据集对ALBERT模型进行训练，得到用于对目标领域数据检测的ALBERT模型，同时，使用目标领域的数据集进行主题模型训练，得到用于文本主题信息提取的LDA模型；随后针对输入的文本信息进行处理，使用ALBERT对该数据进行处理，得到处理后的向量，同时将该文本输入至LDA模型进行主题信息检测，得到文本主题信息，将处理后的向量与文本主题信息进行结合，输入到一个自适应分类器之中进行情感分类，最终输出情感分类标签。

2023-07-24

469KB

一种跨域图像分类方法.pdf

本发明公开一种跨域图像分类方法，该方法用视觉特征提取器提取待分类目标域图像的初始视觉特征，并利用初始视觉特征构建领域对齐损失函数、类别对齐损失函数和结构对齐损失函数，再构建分类器，最后利用视觉特征提取器和分类器获得待分类的目标域图像的分类结果。该方案利用领域对齐损失函数、类别对齐损失函数和结构对齐损失函数来减小待分类目标域图像各个领域之间的差异，提高对跨域图像的分类精度。

2023-07-25

853KB

一种基于原型对比自训练的跨域图像分类方法.pdf

本发明公开了一种基于原型对比自训练的跨域图像分类方法。本发明包括如下步骤：1)通过域不变特征学习方法，获得跨域图像分类模型；2)利用当前最新的跨域图像分类模型预测目标域上图像的伪标签，使用每个批次的数据不断更新每个类别的原型并计算对比损失；3)将分类损失和对比损失结合构成目标函数进行训练，优化更新特征抽取网络与跨域图像分类网络，再回到步骤2)循环执行。本发明将原型对比学习融入到自训练中，通过将目标域中无标签图像数据的分布结构编码进自训练框架中，并在自学习的过程中完全放弃掉源数据，有效解决了域不变表征学习与

2023-06-05

1.6MB

一种基于RPA机制的跨域通办方法及系统.pdf

本发明特别涉及一种基于RPA机制的跨域通办方法及系统。该基于RPA机制的跨域通办方法及系统，为每个事项建立业务路由，结合RPA自动化脚本将各个隔离的政务服务平台与跨域通办系统进行打通，通过在跨域通办系统进行业务表单的定制实现业务的集中收件；通过事项路由的定制，结合RPA自动化脚本，实现业务数据从跨域通办系统到业务属地政务服务平台的自动交换，降低业务对接的复杂度，提高系统交付实施的速度。该基于RPA机制的跨域通办方法及系统，提升了现有跨域通办对接过程中的对接效率，降低了系统对接的研发调试成本，对接更灵活，交

2023-06-04

469KB