预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共19页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113821623A(43)申请公布日2021.12.21(21)申请号202111149870.1(22)申请日2021.09.29(71)申请人平安普惠企业管理有限公司地址518000广东省深圳市前海深港合作区前湾一路1号A栋201室(72)发明人严力(74)专利代理机构广州三环专利商标代理有限公司44202代理人熊永强(51)Int.Cl.G06F16/332(2019.01)G06F16/35(2019.01)G06N3/04(2006.01)G06N3/08(2006.01)G06F40/35(2020.01)权利要求书2页说明书11页附图5页(54)发明名称模型训练方法、装置、设备与存储介质(57)摘要本申请涉及人工智能技术领域,本申请提供一种模型训练方法、装置、设备与存储介质,模型训练方法包括:获取输入样本,并根据输入样本构造第一样本对和第二样本对,第一样本对包含输入样本和与输入样本关联的正样本,第二样本对包含输入样本和与输入样本关联的负样本;将第一样本对输入第一模型,获得输入样本与正样本之间的第一相似度得分;将第二样本对输入第二模型,获得输入样本与负样本之间的第二相似度得分,第二模型与第一模型相同;计算第一相似度得分与第二相似度得分之间的得分差;若得分差不满足目标条件,对第一模型和第二模型参数进行调整,直到得分差满足目标条件。实施本申请,可以提高相似度匹配的准确性。CN113821623ACN113821623A权利要求书1/2页1.一种模型训练方法,其特征在于,包括:从第一训练集中获取输入样本,并根据所述输入样本构造第一样本对和第二样本对,所述第一样本对包含所述输入样本和与所述输入样本关联的正样本,所述第二样本对包含所述输入样本和与所述输入样本关联的负样本,所述输入样本为问答系统中用户的语音数据转换得到的文本数据;将所述第一样本对输入第一模型,获得所述输入样本与所述正样本之间的第一相似度得分;将所述第二样本对输入第二模型,获得所述输入样本与所述负样本之间的第二相似度得分,所述第二模型与所述第一模型相同;计算所述第一相似度得分与所述第二相似度得分之间的得分差;若所述得分差不满足目标条件,对所述第一模型和所述第二模型的参数进行调整,并从所述第一训练集的剩余样本中获取输入样本,所述剩余样本是所述第一训练集中未被获取的输入样本;根据从所述剩余样本中获取的输入样本构造第一样本对和第二样本对,直到所述得分差满足所述目标条件,将参数调整后的第一模型或第二模型确定为训练好的目标模型。2.如权利要求1所述的方法,其特征在于,所述正样本与所述输入样本之间的语义相似度大于相似度阈值,所述负样本与所述输入样本之间的语义相似度小于所述相似度阈值。3.如权利要求1或2所述的方法,其特征在于,所述若所述得分差不满足目标条件,对所述第一模型和所述第二模型的参数进行调整之前,还包括:通过逻辑回归sigmoid函数将所述得分差进行归一化,获得归一化函数值;根据所述归一化函数值与预设值之间的差异,确定所述得分差是否满足目标条件。4.如权利要求3所述的方法,其特征在于,所述预设值为1;所述根据所述归一化函数值与预设值之间的差异,确定所述得分差是否满足目标条件,包括:根据所述归一化函数值与1之间的差值,计算第一损失;若所述第一损失大于或者等于第一阈值,则确定所述得分差不满足目标条件;若所述第一损失小于所述第一阈值,则确定所述得分差满足目标条件。5.如权利要求4所述的方法,其特征在于,所述将参数调整后的第一模型或第二模型确定为训练好的目标模型之后,还包括:获取待查询文本和至少两个候选文本;将所述待查询文本分别与所述至少两个候选文本中的每个候选文本构建文本对,获得至少两个文本对,所述文本对包括所述待查询文本和一个候选文本;将所述至少两个文本对中每个文本对输入所述训练好的目标模型,获得所述每个文本对的目标相似度得分;从所述至少两个文本对中选择目标相似度得分最高的文本对,作为目标文本对;将所述目标文本对中的候选文本所对应的预设文本确定为所述待查询文本的回答文本。6.如权利要求1‑5任一项所述的方法,其特征在于,所述从第一训练集中获取输入样本之前,还包括:2CN113821623A权利要求书2/2页获取待训练的第三模型;获取第二训练集,所述第二训练集包括多个第三样本对,所述第三样本对中包含第一训练样本和第二训练样本,所述第三样本对被标注实际相似度比较结果;采用所述第二训练集对所述第三模型进行训练,获得训练好的第三模型,作为所述第一模型。7.如权利要求6所述的方法,其特征在于,所述采用所述第二训练集对所述第三模型进行训练,获得训练好的第三模型,包括:从所述第二训练集中获取第三样本对,作