预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共19页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113868459A(43)申请公布日2021.12.31(21)申请号202110712040.9G06N3/04(2006.01)(22)申请日2021.06.25G06N3/08(2006.01)(71)申请人之江实验室地址310023浙江省杭州市余杭区文一西路1818号人工智能小镇10号楼申请人复旦大学(72)发明人魏忠钰李泽君(74)专利代理机构杭州浙科专利事务所(普通合伙)33213代理人孙孟辉(51)Int.Cl.G06F16/58(2019.01)G06F16/33(2019.01)G06F40/211(2020.01)G06F40/289(2020.01)权利要求书2页说明书13页附图3页(54)发明名称模型训练方法、跨模态表征方法、无监督图像文本匹配方法及装置(57)摘要本发明的目的是提供一种模型训练方法、跨模态表征方法、无监督图像文本匹配方法及装置,所述方法包括:计算训练文档中图片与句子的两两相似度值;基于所述相似度值,确定正样本对集和负样本对集;其中,所述正样本对集中有预设数量的正样本对;所述负样本对集中有预设数量的负样本对;所述正样本对集和所述负样本对集用于进一步训练所述模型,直至预设数量的所述正样本对的平均相似度值大于预设数量的所述负样本对的平均相似度值,且两者差值符合预设条件。上述实施方式可以减小采样的偏差,以更好的训练模型来对图片和句子进行匹配。CN113868459ACN113868459A权利要求书1/2页1.一种模型训练方法,其特征在于,应用于无监督图像文本匹配模型,所述方法包括:计算训练文档中图片与句子的两两相似度值;基于所述相似度值,确定正样本对集和负样本对集;其中,所述正样本对集中有预设数量的正样本对;所述负样本对集中有预设数量的负样本对;所述正样本对集和所述负样本对集用于进一步训练所述模型,直至预设数量的所述正样本对的平均相似度值大于预设数量的所述负样本对的平均相似度值,且两者差值符合预设条件。2.如权利要求1所述方法,其特征在于,在确定正样本对集和负样本对集的步骤中包括:在所述图片与所述句子来自同一文档的情况下:对应于每个所述图片,将该图片与其相似度值最高的所述句子放入候选正样本对集;将所述候选正样本对集中相似度值最高的预设数量的所述正样本对放入所述正样本对集;和/或,对应于每个所述句子,将该句子与其相似度值最高的所述图片放入候选正样本对集;将所述候选正样本对集中相似度值最高的预设数量的所述正样本对放入所述正样本对集。3.如权利要求1所述方法,其特征在于,在确定正样本对集和负样本对集的步骤中包括:在所述图片与所述句子来自同一文档的情况下:对应于每个所述图片,将该图片与其相似度值最低的所述句子放入候选负样本对集;将所述候选负样本对集中相似度值最低的预设数量的所述负样本对放入所述负样本对集;和/或,对应于每个所述句子,将该句子与其相似度值最低的所述图片放入候选负样本对集;将所述候选负样本对集中相似度值最低的预设数量的所述负样本对放入所述负样本对集。4.如权利要求1所述方法,其特征在于,在确定正样本对集和负样本对集的步骤中包括:在确定所述负样本对集的情况时,所述图片与所述句子来自不同文档;对应于每个所述图片,将该图片与其相似度值最高的所述句子放入候选负样本对集;将所述候选负样本对集中相似度值最高的预设数量的所述负样本对放入所述负样本对集;和/或,对应于每个所述句子,将该句子与其相似度值最高的所述图片放入候选负样本对集;将所述候选负样本对集中相似度值最高的预设数量的所述负样本对放入所述负样本对集。5.如权利要求1所述方法,其特征在于,所述训练文档为残次文档即该文档中部分句子和/或图片被遮盖。6.一种模型训练装置,其特征在于,应用于无监督图像文本匹配模型,所述装置包括:2CN113868459A权利要求书2/2页计算单元,所述计算单元用于计算训练文档中图片与句子的两两相似度值;采样单元,所述采样单元用于基于所述相似度值,确定正样本对集和负样本对集;其中,所述正样本对集中有预设数量的正样本对;所述负样本对集中有预设数量的负样本对;所述正样本对集和所述负样本对集用于进一步训练所述模型,直至预设数量的所述正样本对的平均相似度值大于预设数量的所述负样本对的平均相似度值,且两者差值符合预设条件。7.一种跨模态表征方法,其特征在于,应用于无监督图像文本匹配模型的训练或无监督图像文本匹配,所述方法包括:根据获取的目标文档的图片信息,获取对应图片的图片表征信息,所述图片表征信息包括该图片信息对应的至少一个对象,以及概念信息;所述概念信息为根据所述对象预测出的标签;根据获取的所述目标文档的句子信息,获取对应句子的句子表征信息;将所