预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共20页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113722466A(43)申请公布日2021.11.30(21)申请号202111295902.9G06N3/04(2006.01)(22)申请日2021.11.03G06N3/08(2006.01)(71)申请人北京世纪好未来教育科技有限公司地址100089北京市海淀区中关村大街32号蓝天和盛大厦1702-03室(72)发明人刘军秦勇(74)专利代理机构北京开阳星知识产权代理有限公司11710代理人唐博(51)Int.Cl.G06F16/332(2019.01)G06F16/33(2019.01)G06F16/58(2019.01)G06F40/258(2020.01)G06F40/30(2020.01)权利要求书3页说明书11页附图5页(54)发明名称批改模型训练方法、批改方法、装置、电子设备和介质(57)摘要本公开涉及一种批改模型训练方法、批改方法、装置、电子设备和介质;其中,候选批改模型包括第一分支和第二分支,该方法包括:将训练样本中的作答图像和训练样本中的题目描述字符串输入候选批改模型的第一分支,得到第一图像特征;基于候选批改模型的第二分支,根据第一图像特征和训练样本中的答案描述字符串,获得预测结果;基于预设损失函数,根据预测结果对第一分支和第二分支进行训练,获得训练后的目标批改模型。本公开实施例能够有效实现对作图题的作答图像的准确批改。CN113722466ACN113722466A权利要求书1/3页1.一种批改模型训练方法,其特征在于,应用于候选批改模型,所述候选批改模型包括第一分支和第二分支,包括:将训练样本中的作答图像和所述训练样本中的题目描述字符串输入所述候选批改模型的第一分支,得到第一图像特征;基于所述候选批改模型的第二分支,根据所述第一图像特征和所述训练样本中的答案描述字符串,获得预测结果;基于预设损失函数,根据所述预测结果对所述第一分支和所述第二分支进行训练,获得训练后的目标批改模型。2.根据权利要求1所述的方法,其特征在于,所述将训练样本中的作答图像和所述训练样本中的题目描述字符串输入所述候选批改模型的第一分支,得到第一图像特征,包括:对训练样本中的题目描述字符串进行编码,得到题目描述向量;基于所述候选批改模型的第一分支中的第一预设结构网络,根据所述题目描述向量得到训练样本中的作答图像对应的题目特征映射;根据所述第一分支中的第二预设结构网络中串联的四个块和所述题目特征映射,对所述作答图像进行处理,得到第一图像特征。3.根据权利要求2所述的方法,其特征在于,所述根据所述第一分支中的第二预设结构网络中串联的四个块和所述题目特征映射,对所述作答图像进行处理,得到第一图像特征,包括:将所述作答图像输入所述第一分支中的第二预设结构网络的第一个块中,将所述第一个块的输出结果与所述题目特征映射进行相乘并输入下一个块中;依次将当前块的输出与所述题目特征映射进行相乘并输入下一个块中,根据所述第二预设结构网络中最后一个块的输出确定第一图像特征,所述当前块为所述第二预设结构网络中正在进行数据处理的块。4.根据权利要求2所述的方法,其特征在于,所述基于所述候选批改模型的第一分支中的第一预设结构网络,根据所述题目描述向量得到训练样本中的作答图像对应的题目特征映射,包括:将所述题目描述向量输入所述候选批改模型的第一分支中的第一预设结构网络,得到的目标向量;基于所述第一预设结构网络中预先构建的注意力层,将每个所述目标向量进行线性变换,得到每个所述目标向量对应的变换向量;将每个所述变换向量进行拼接,得到训练样本中的作答图像对应的题目特征映射。5.根据权利要求1所述的方法,其特征在于,所述基于所述候选批改模型的第二分支,根据所述第一图像特征和所述训练样本中的答案描述字符串,获得预测结果,包括:对所述训练样本中的答案描述字符串进行编码,得到答案描述向量;将所述答案描述向量输入所述候选批改模型的第二分支,得到第二图像特征;根据所述第一图像特征和所述第二图像特征,得到预测结果。6.根据权利要求5所述的方法,其特征在于,所述根据所述第一图像特征和所述第二图像特征,得到预测结果,包括:基于预设向量维度,对所述第一图像特征和所述第二图像特征进行拼接;2CN113722466A权利要求书2/3页对拼接结果进行卷积操作,得到所述作答图像的预测结果。7.根据权利要求1所述的方法,其特征在于,所述将训练样本中的作答图像和所述训练样本中的题目描述字符串输入所述候选批改模型的第一分支,得到第一图像特征之前,还包括:获取训练样本,所述训练样本包括:批改题目的作答图像、所述批改题目对应的题目描述字符串和所述批改题目对应的答案描述字符串。8.根据权利要求1所述的方法,其特征在于,所述