预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共26页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN115019295A(43)申请公布日2022.09.06(21)申请号202210738482.5(22)申请日2022.06.27(71)申请人北京爱奇艺科技有限公司地址100080北京市海淀区海淀北一街2号11层1101(72)发明人赵瑞书(74)专利代理机构北京润泽恒知识产权代理有限公司11319专利代理师吕俊秀(51)Int.Cl.G06V20/62(2022.01)G06V30/19(2022.01)G06N20/00(2019.01)权利要求书3页说明书18页附图4页(54)发明名称模型训练方法、文本行确定方法及装置(57)摘要本申请实施例提供了一种模型训练方法、装置、电子设备及存储介质。所述方法包括:获取第一样本图像和第二样本图像,所述第一样本图像和所述第二样本图像均为包含文本行的样本图像,所述第一样本图像为模拟的含有多种文本字体的图像;基于所述第一样本图像对待训练字体识别模型进行训练,得到预训练字体识别模型;基于所述第一样本图像和所述第二样本图像对所述预训练字体识别模型进行训练,得到目标字体识别模型。本申请实施例可以提高字体识别模型的识别效果,准确区分图像内的台词文本行和非台词文本行。CN115019295ACN115019295A权利要求书1/3页1.一种模型训练方法,其特征在于,包括:获取第一样本图像和第二样本图像,所述第一样本图像和所述第二样本图像均为包含文本行的样本图像,所述第一样本图像为模拟的含有多种文本字体的图像;基于所述第一样本图像对待训练字体识别模型进行训练,得到预训练字体识别模型;基于所述第一样本图像和所述第二样本图像对所述预训练字体识别模型进行训练,得到目标字体识别模型。2.根据权利要求1所述的方法,其特征在于,所述获取第一样本图像和第二样本图像,包括:从预设图像库中获取包含有文本行的第二样本图像;从所述预设图像库中获取不包含文本行的初始图像;在所述初始图像内添加文本行,生成第一样本图像;在所述第一样本图像中每个文本行内包含多种文本字体。3.根据权利要求1所述的方法,其特征在于,在所述第一样本图像中每个文字均标注有第一字体标签,在同一文本行内相邻两种字体之间标注有分隔符;所述基于所述第一样本图像对待训练字体识别模型进行训练,得到预训练字体识别模型,包括:将所述第一样本图像输入至所述待训练字体识别模型;基于所述待训练字体识别模型对所述第一样本图像进行处理,得到所述第一样本图像的包含有分隔符的预测字体标签;根据所述第一字体标签和所述预测字体标签,计算得到所述待训练字体识别模型的第一损失值;在所述第一损失值处于第一预设范围内的情况下,将训练后的待训练字体识别模型确定为所述预训练字体识别模型。4.根据权利要求3所述的方法,其特征在于,所述根据所述第一字体标签和所述预测字体标签,计算得到所述待训练字体识别模型的第一损失值,包括:根据所述预测字体标签,确定所述第一样本图像内每个文本行对应的多条字体路径;根据所述第一字体标签和所述预测字体标签,确定每个文字所属字体的字体概率;根据每个文字所属字体的字体概率,计算得到所述多条字体路径对应的字体路径概率;根据所述字体路径概率中的最大字体路径概率,计算得到所述待训练字体识别模型的第一损失值。5.根据权利要求3所述的方法,其特征在于,在所述根据所述第一字体标签和所述预测字体标签,计算得到所述待训练字体识别模型的第一损失值之后,还包括:在所述第一损失值处于第一预设范围之外的情况下,根据所述第一样本图像对训练后的待训练字体识别模型进行训练,直至计算得到的第一损失值处于所述第一预设范围内。6.根据权利要求1所述的方法,其特征在于,在所述第一样本图像中每个文字均标注有第二字体标签,在所述第二样本图像中每个文字均标注有第三字体标签,且在同一文本行内相邻两种字体之间标注有分隔符;所述基于所述第一样本图像和所述第二样本图像对所述预训练字体识别模型进行训2CN115019295A权利要求书2/3页练,得到目标字体识别模型,包括:将所述第一样本图像和所述第二样本图像输入至所述预训练字体识别模型;基于所述预训练字体识别模型对所述第一样本图像和所述第二样本图像进行处理,得到所述第一样本图像的第一预测字体标签,及所述第二样本图像的包含有分隔符的第二预测字体标签;根据所述第二字体标签与所述第一预测字体标签、及所述第三字体标签和所述第二预测字体标签,计算得到所述预训练字体识别模型的第二损失值;在所述第二损失值处于第二预设范围内的情况下,将训练后的预训练字体识别模型确定为所述目标字体识别模型。7.根据权利要求6所述的方法,其特征在于,所述根据所述第二字体标签与所述第一预测字体标签、及所述第三字体标签和所述第二预测字体标签,计算得