预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共18页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN115269809A(43)申请公布日2022.11.01(21)申请号202211135890.8(22)申请日2022.09.19(71)申请人支付宝(杭州)信息技术有限公司地址310000浙江省杭州市西湖区西溪路556号8层B段801-11(72)发明人王维强王昊天吴晓烽(74)专利代理机构济南信达专利事务所有限公司37100专利代理师李世喆(51)Int.Cl.G06F16/332(2019.01)A63F13/87(2014.01)G06K9/62(2022.01)权利要求书2页说明书11页附图4页(54)发明名称意图识别模型的训练方法和装置及意图识别方法和装置(57)摘要本说明书实施例描述了意图识别模型的训练方法和装置及意图识别方法和装置。根据实施例的方法,可以在模型训练的前几轮弱化对特定问题的训练,然后利用前几轮训练的意图识别模型可以找出需要进行区分的回答所对应的意图。进一步通过对这些意图的标签进行重置后再训练意图识别模型,能够使得训练得到的意图识别模型对特定问题的回答也具有较好的识别效果,从而达到提高意图识别准确性的目的。CN115269809ACN115269809A权利要求书1/2页1.意图识别模型的训练方法,包括:获取用于进行模型训练的样本训练数据;其中,所述样本训练数据包括:作为样本输入数据的问题和回答的集合,以及作为样本输出数据的样本意图;所述问题包括:特定问题;所述特定问题满足:该特定问题下出现的回答所对应的意图与在其他问题下出现该回答时所对应的意图相同;利用所述样本训练数据进行M轮模型训练时,在前N轮模型训练中弱化所述特定问题的训练,以使前N轮训练得到的意图识别模型识别出所述特定问题下回答所对应的意图的概率小于第一预设阈值;其中,M和N均为正整数,且N<M;利用前N轮模型训练得到的意图识别模型对所述样本输入数据进行识别,得到至少一个第一意图;根据所述样本意图的标签对各个所述第一意图的标签进行重置;以及,利用对所述第一意图的标签进行重置后的样本训练数据继续训练所述意图识别模型。2.根据权利要求1所述的方法,其中,所述样本训练数据包括:第一样本训练数据,该第一样本训练数据中的问题不包括所述特定问题;所述在前N轮模型训练中弱化所述特定问题的训练,包括:在前N轮模型训练中利用所述第一样本训练数据训练所述意图识别模型。3.根据权利要求1所述的方法,其中,所述利用前N轮模型训练得到的意图识别模型对所述样本输入数据进行识别得到至少一个第一意图,包括:将所述样本输入数据输入前N轮模型训练得到的意图识别模型中,输出各样本意图的概率值;从所述样本意图中确定输入所述意图识别模型中的各样本输入数据所对应的目标意图;其中,所述目标意图用于表征所述样本输入数据中的回答所具有的真实意图;从各样本意图的概率值中确定所述目标意图的概率值;以及,将所述目标意图中概率值小于第二预设阈值的目标意图确定为所述第一意图。4.根据权利要求3所述的方法,其中,所述目标意图的标签为第一标签,所述样本意图中不为所述目标意图的意图的标签为第二标签;所述根据所述样本意图的标签对各个所述第一意图的标签进行重置,包括:将所述第一意图的标签重置为所述第二标签。5.根据权利要求3所述的方法,其中,所述目标意图的标签为第一标签,所述样本意图中不为所述目标意图的意图的标签为第二标签;所述根据所述样本意图的标签对各个所述第一意图的标签进行重置,包括:将所述样本训练数据中的样本意图进行复制,得到扩展意图;其中,每一个扩展意图唯一对应一个样本意图;将所述第一意图所对应的样本意图的标签重置为所述第二标签;以及,将所述第一意图所对应的扩展意图的标签重置为第一标签;所述利用对所述第一意图的标签进行重置后的样本训练数据继续训练所述意图识别模型,包括:将对所述第一意图重置标签后的样本意图和扩展意图及其标签作为所述样本输出数据,继续训练所述意图识别模型。2CN115269809A权利要求书2/2页6.意图识别方法,包括:获取待进行意图识别的待识别数据;利用意图识别模型对所述待识别数据进行识别,得到意图识别结果;其中,所述意图识别模型是利用如权利要求1至5中任一所述的意图识别模型的训练方法训练得到的。7.根据权利要求6所述的方法,其中,所述待识别数据包括:问题和回答的待识别集合;所述利用意图识别模型对所述待识别数据进行识别得到意图识别结果,包括:将所述待识别数据输入所述意图识别模型中,得到所述意图识别模型输出的初级意图识别结果;当所述初级意图识别结果为扩展意图时,将所述待识别集合中的回答输入预先训练的问题预测模型中,得到预测问题;其中,所述拓展意图用于表征对训练所述意图识别模型的样本意图进行复制得到的意图;所述问题预测模