预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共18页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN115033685A(43)申请公布日2022.09.09(21)申请号202110235366.7(22)申请日2021.03.03(71)申请人中国移动通信有限公司研究院地址100053北京市西城区宣武门西大街32号申请人中国移动通信集团有限公司(72)发明人郭叶周志红程印超(74)专利代理机构北京银龙知识产权代理有限公司11243专利代理师许静曹娜(51)Int.Cl.G06F16/35(2019.01)G06F40/205(2020.01)G06F40/30(2020.01)权利要求书3页说明书11页附图3页(54)发明名称观点抽取方法、装置及设备(57)摘要本发明提供一种观点抽取方法、装置及设备。本发明方法包括获取待抽取的第一文本;基于预先训练的MRC模型,对第一文本进行观点抽取,得到第一文本对应的目标评价对象、目标评价词和目标情感极性类别;MRC模型基于第一训练数据集合和第二训练数据集合训练得到,所述第一训练数据集合包括由文本样本中评价对象和评价词构建的至少一个第一问题、针对至少一个第一问题的答案和文本样本,第二训练数据集合包括由评价对象对应的情感极性类别构建的至少一个第二问题、针对至少一个第二问题的答案和文本样本。本发明通过构建问题,能够迭代生成训练数据,达到增强数据,提升模型效果,在小数据集、迁移学习下表现更好,模型具有可移植性。CN115033685ACN115033685A权利要求书1/3页1.一种观点抽取方法,其特征在于,包括:获取待抽取的第一文本;基于预先训练的机器阅读理解MRC模型,对所述第一文本进行观点抽取,得到所述第一文本对应的目标评价对象、目标评价词和目标情感极性类别;其中,所述MRC模型基于第一训练数据集合和第二训练数据集合训练得到,所述第一训练数据集合包括由文本样本中评价对象和评价词构建的至少一个第一问题、针对所述至少一个第一问题的答案和所述文本样本,所述第二训练数据集合包括由评价对象对应的情感极性类别构建的至少一个第二问题、针对所述至少一个第二问题的答案和所述文本样本。2.根据权利要求1所述的方法,其特征在于,获取待抽取的第一文本之前,所述方法还包括:获取所述文本样本中评价对象、评价词和评价对象对应的情感极性类别;根据由所述评价对象和所述评价词构建的至少一个第一问题,获得第一训练数据集合;根据由评价对象对应的情感极性类别构建的至少一个第二问题,获得第二训练数据集合;基于所述第一训练数据集合和所述第二训练数据集合进行模型训练,得到所述MRC模型。3.根据权利要求2所述的方法,其特征在于,所述根据由所述评价对象和所述评价词构建的至少一个第一问题,获得第一训练数据集合,包括:对所述评价对象和所述评价词,按照预设类型进行分类,得到用于构建问题的N个第一类提问类型,N≥1,且N为正整数;针对所述N个第一类提问类型分别构建问题,得到N个第一问题;针对各个第一问题,分别抽取对应第一问题的评价对象和评价词中的至少一者在所述文本样本中的起始位置和结束位置,并作为对应第一问题的答案;将生成的N个训练数据三元组确定为所述第一训练数据集合,其中,每个训练数据三元组包括第一问题、第一问题对应的答案和所述文本样本。4.根据权利要求3所述的方法,其特征在于,所述第一类提问类型采用对应所述第一类提问类型的释义描述方式构建问题。5.根据权利要求2所述的方法,其特征在于,所述根据由评价对象对应的情感极性类别构建的至少一个第二问题,获得第二训练数据集合,包括:基于评价对象对应的情感极性类别,得到用于构建问题的M个第二类提问类型,M≥1,且M为正整数;针对所述M个第二类提问类型分别构建问题,得到M个第二问题;针对各个第二问题,预设对应第二问题的答案;将生成的M个训练数据三元组确定为所述第二训练数据集合,其中每个训练数据三元组包括第二问题、第二问题对应的答案和所述文本样本。6.根据权利要求1所述的方法,其特征在于,所述基于预先训练的机器阅读理解MRC模型,对所述第一文本进行观点抽取,得到所述第一文本对应的目标评价对象、目标评价词和目标情感极性类别,包括:2CN115033685A权利要求书2/3页将所述第一文本输入至所述MRC模型,得到所述第一文本对应的目标评价对象和目标评价词的起始位置和结束位置,以及所述目标评价对象对应的类别标签;根据所述第一文本对应的目标评价对象和目标评价词的起始位置和结束位置,得到所述第一文本对应的目标评价对象和目标评价词;根据所述目标评价对象对应的类别标签,得到与所述类别标签对应的目标情感极性类别。7.一种观点抽取装置,其特征在于,包括:第一获取模块,用于获取待抽取的第一文本;观点抽取模块,用于基于预先训练的机器阅读理解MRC模型,对所述第一