预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共16页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN110866543A(43)申请公布日2020.03.06(21)申请号201910995352.8(22)申请日2019.10.18(71)申请人支付宝(杭州)信息技术有限公司地址310000浙江省杭州市西湖区西溪路556号8层B段801-11(72)发明人曹绍升崔卿(74)专利代理机构北京博思佳知识产权代理有限公司11415代理人周嗣勇(51)Int.Cl.G06K9/62(2006.01)G06N3/04(2006.01)G06N20/00(2019.01)权利要求书2页说明书7页附图6页(54)发明名称图片检测及图片分类模型的训练方法和装置(57)摘要本说明书实施例提供一种图片检测及图片分类模型的训练方法和装置,根据由原始训练图片以及伪文本图片共同训练得到的图片分类模型对待检测图片进行检测,以获取包括预设类别的第一文本的目标待检测图片。由于训练图片分类模型时同时采用了原始训练图片以及伪文本图片,增加了训练样本的多样性,产生了更多的文本表达,因此,提高了图片检测的准确度。CN110866543ACN110866543A权利要求书1/2页1.一种图片检测方法,所述方法包括:获取待检测图片;根据由原始训练图片和伪文本图片预先训练的图片分类模型对所述待检测图片进行检测,以获取包括预设类别的第一文本的目标待检测图片;其中,所述伪文本图片中的第二文本根据所述原始训练图片中所述预设类别的第三文本生成。2.根据权利要求1所述的方法,所述伪文本图片的数量为多个,各个伪文本图片中的第二文本分别通过以下任一方式生成:将所述预设类别的第三文本输入预先训练的机器学习模型,以生成所述第二文本;或者将所述预设类别的第三文本输入预先训练的机器学习模型,以生成第四文本,对所述第四文本进行字体变换和/或字符旋转,以生成所述第二文本。3.根据权利要求2所述的方法,所述机器学习模型根据所述原始训练图片中的第三文本以及所述第三文本的类别标签训练得到。4.根据权利要求2所述的方法,所述图片分类模型根据加权处理后的原始训练图片以及加权处理后的伪文本图片训练得到,且所述伪文本图片的权重小于所述原始训练图片的权重。5.根据权利要求4所述的方法,所述伪文本图片的权重通过所述机器学习模型生成。6.根据权利要求1至5任意一项所述的方法,所述机器学习模型为生成式对抗网络;和/或所述图片分类模型为卷积神经网络。7.一种图片分类模型的训练方法,所述方法包括:根据原始训练图片中预设类别的第三文本生成第二文本;根据所述第二文本生成伪文本图片;根据所述原始训练图片以及所述伪文本图片训练图片分类模型。8.根据权利要求7所述的方法,根据原始训练图片中预设类别的第三文本生成第二文本的步骤包括:将所述预设类别的第三文本输入预先训练的机器学习模型,以生成所述第二文本;或者将所述预设类别的第三文本输入预先训练的机器学习模型,以生成第四文本,对所述第四文本进行字体变换和/或字符旋转,以生成所述第二文本。9.根据权利要求8所述的方法,所述方法还包括:根据所述原始训练图片中的第三文本以及所述第三文本的类别标签训练所述机器学习模型。10.根据权利要求8所述的方法,所述方法还包括:分别对所述原始训练图片以及所述伪文本图片进行加权处理,所述伪文本图片的权重小于所述原始训练图片的权重;根据加权处理后的原始训练图片以及加权处理后的伪文本图片训练所述图片分类模型。11.根据权利要求10所述的方法,所述方法还包括:将所述伪文本图片输入所述机器学习模型,以获取所述伪文本图片的权重。2CN110866543A权利要求书2/2页12.根据权利要求7至11任意一项所述的方法,所述机器学习模型为生成式对抗网络;和/或所述图片分类模型为卷积神经网络。13.一种图片检测装置,所述装置包括:获取模块,用于获取待检测图片;检测模块,用于根据由原始训练图片和伪文本图片预先训练的图片分类模型对所述待检测图片进行检测,以获取包括预设类别的第一文本的目标待检测图片;其中,所述伪文本图片中的第二文本根据所述原始训练图片中所述预设类别的第三文本生成。14.一种图片分类模型的训练装置,所述装置包括:第一生成模块,用于根据原始训练图片中预设类别的第三文本生成第二文本;第二生成模块,用于根据所述第二文本生成伪文本图片;训练模块,用于根据所述原始训练图片以及所述伪文本图片训练图片分类模型。15.一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现权利要求1至12任意一项所述的方法。16.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现权利要求1至12任意一项所述的方法。3CN110866543A说明