预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共16页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN115017896A(43)申请公布日2022.09.06(21)申请号202210775525.7G06N7/00(2006.01)(22)申请日2022.07.01(71)申请人北京明略昭辉科技有限公司地址100082北京市海淀区北三环西路25号27号楼二层2020室(72)发明人董世鹏(74)专利代理机构北京超成律师事务所11646专利代理师王晓菲(51)Int.Cl.G06F40/279(2020.01)G06F16/33(2019.01)G06F16/335(2019.01)G06K9/62(2022.01)G06N3/04(2006.01)G06N3/08(2006.01)权利要求书2页说明书9页附图4页(54)发明名称一种模型训练方法、装置、计算机设备及可读存储介质(57)摘要本申请提供了一种模型训练方法、装置、计算机设备及可读存储介质,其中,将目标文本的分词结果的文本特征向量中的每个标签出现的第一概率输入至条件随机场损失函数中,以得到用于描述所述文本特征向量中各向量值之间差异程度的损失值;根据所述损失值,利用梯度回传算法对用于进行特征向量标签筛选的条件随机场模型进行训练;当训练次数满足预设阈值时,将训练后的条件随机场模型作为目标模型进行存储。采用上述方法,通过根据文本特征向量中各向量值之间的差异程度进行模型训练,有利于提高使用模型进行数据预测的准确度。CN115017896ACN115017896A权利要求书1/2页1.一种模型训练方法,其特征在于,所述方法包括:将目标文本的分词结果的文本特征向量中的每个标签出现的第一概率输入至条件随机场损失函数中,以得到用于描述所述文本特征向量中各向量值之间差异程度的损失值,其中,所述每个标签为预先为所述文本特征向量中的每个向量值设置的,不同向量值具有不同的标签,所述第一概率是根据为所述每个标签设置的标签值和预设的概率算法进行计算后得到的;根据所述损失值,利用梯度回传算法对用于进行特征向量标签筛选的条件随机场模型进行训练;当训练次数满足预设阈值时,将训练后的条件随机场模型作为目标模型进行存储。2.根据权利要求1所述的方法,其特征在于,在将目标文本的文本特征向量中的每个标签出现的概率输入至条件随机场损失函数中,以得到用于描述所述文本特征向量中各向量值之间差异程度的损失值前,所述方法还包括:对于所述目标文本的分词结果中的每个分词结果,将该分词结果输入至用于对分词结果的候选文本特征向量进行确定的特征向量确定模型中,以得到该分词结果的候选特征向量;将所述候选特征向量依次输入至用于强化特征表达的双向长短期记忆人工神经网络和用于进行特征向量降维的降维模型中,以得到该分词结果的文本特征向量。3.根据权利要求2所述的方法,其特征在于,在对于所述目标文本的分词结果中的每个分词结果,将该分词结果输入至用于对分词结果的文本特征向量进行确定的特征向量确定模型中,以得到该分词结果的特征向量前,所述方法还包括:对于至少一个目标文本中的每个目标文本,将该目标文本输入至用于对文本进行分词处理的分词处理模型中,以得到该目标文本的分词结果。4.根据权利要求3所述的方法,其特征在于,在对于至少一个目标文本中的每个目标文本,将该目标文本输入至用于对文本进行分词处理的分词处理模型中,以得到该目标文本的分词结果前,所述方法还包括:将待处理文本中的特殊字符删除,以得到待拆分文本;根据预设拆分规则将所述待拆分文本进行拆分,以得到至少一个目标文本,其中,所述至少一个目标文本中的每个目标文本的字符数小于等于512。5.根据权利要求1所述的方法,其特征在于,在当训练次数满足预设阈值时,将训练后的条件随机场模型作为目标模型进行存储后,所述方法还包括:将待推理文本的待筛选特征向量和为所述待筛选特征向量设置的待筛选标签输入至所述目标模型中对所述待筛选标签进行筛选,以得到目标标签;根据所述目标标签,从预设的实体与标签之间的映射关系中确定出目标实体。6.一种模型训练装置,其特征在于,所述装置包括:损失值确定模块,用于将目标文本的分词结果的文本特征向量中的每个标签出现的第一概率输入至条件随机场损失函数中,以得到用于描述所述文本特征向量中各向量值之间差异程度的损失值,其中,所述每个标签为预先为所述文本特征向量中的每个向量值设置的,不同向量值具有不同的标签,所述第一概率是根据为所述每个标签设置的标签值和预设的概率算法进行计算后得到的;2CN115017896A权利要求书2/2页模型训练模块,用于根据所述损失值,利用梯度回传算法对用于进行特征向量标签筛选的条件随机场模型进行训练;模型存储模块,用于当训练次数满足预设阈值时,将训练后的条件随机场模型作为目标模型进行存储。7.根据权利要求