预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共32页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN114973221A(43)申请公布日2022.08.30(21)申请号202110215064.3G06V30/10(2022.01)(22)申请日2021.02.25G06V10/82(2022.01)G06N3/04(2006.01)(71)申请人阿里巴巴集团控股有限公司G06N3/08(2006.01)地址英属开曼群岛大开曼资本大厦一座四层847号邮箱(72)发明人杨志博(74)专利代理机构北京太合九思知识产权代理有限公司11610专利代理师刘戈孙明子(51)Int.Cl.G06V20/62(2022.01)G06V10/764(2022.01)G06V10/94(2022.01)G06V10/70(2022.01)G06F40/174(2020.01)权利要求书3页说明书19页附图9页(54)发明名称信息识别方法、装置、设备和存储介质(57)摘要本发明实施例提供一种信息识别方法、装置、设备和存储介质,该方法包括:在界面的第一显示区域内显示目标对象的图像;确定图像中包含的至少一个信息结构体及至少一个信息结构体各自对应的标记信息,每个信息结构体对应于所述目标对象中的不同字段;在界面的第二显示区域内输出至少一个信息结构体和至少一个信息结构体各自对应的标记信息。用户可以基于每个信息结构体对应的标记信息快速区分各信息结构体,以便对各信息结构体进行审核、校正。CN114973221ACN114973221A权利要求书1/3页1.一种信息识别方法,其特征在于,包括:在界面的第一显示区域内显示目标对象的图像;确定所述图像中包含的至少一个信息结构体及所述至少一个信息结构体各自对应的标记信息,每个信息结构体对应于所述目标对象中的不同字段;在所述界面的第二显示区域内,输出所述至少一个信息结构体和所述至少一个信息结构体各自对应的标记信息。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:响应于用户根据所述至少一个信息结构体各自对应的标记信息针对目标信息结构体输入的纠正操作,执行所述纠正操作。3.根据权利要求1所述的方法,其特征在于,确定所述至少一个信息结构体各自对应的标记信息,包括:确定所述至少一个信息结构体各自对应的置信度;根据所述至少一个信息结构体各自对应的置信度,确定所述至少一个信息结构体各自对应的标记信息。4.根据权利要求3所述的方法,其特征在于,每个信息结构体中包括字段属性、字段位置和字段内容,确定所述至少一个信息结构体各自对应的置信度,包括:对于所述至少一个信息结构体中的任一信息结构体,根据如下至少一种置信度,确定所述任一信息结构体的置信度:所述任一信息结构体中字段位置的置信度,所述任一信息结构体中字段内容的置信度,所述任一信息结构体中字段属性与字段内容间对应关系的置信度。5.根据权利要求4所述的方法,其特征在于,所述确定所述任一信息结构体的置信度,包括:根据预设的置信度权重,确定所述任一信息结构体的置信度;其中,所述置信度权重包括如下至少一种:与所述字段位置的置信度对应的第一权重,与所述字段内容的置信度对应的第二权重,与所述字段属性与字段内容间对应关系的置信度对应的第三权重。6.根据权利要求5所述的方法,其特征在于,所述第三权重大于或等于所述第二权重,所述第二权重大于或等于所述第一权重。7.根据权利要求3所述的方法,其特征在于,所述根据所述至少一个信息结构体各自对应的置信度,确定所述至少一个信息结构体各自对应的标记信息,包括:对于所述至少一个信息结构体中的任一信息结构体,若所述任一信息结构体的置信度小于第一预设阈值,则确定所述任一信息结构体对应的标记信息为第一标记信息;若所述任一信息结构体的置信度在第一预设阈值与第二预设阈值之间,则确定所述任一信息结构体对应的标记信息为第二标记信息;若所述任一信息结构体的置信度大于第二预设阈值,则确定所述任一信息结构体对应的标记信息为第三标记信息。8.根据权利要求1所述的方法,其特征在于,所述确定所述图像中包含的至少一个信息结构体,包括:通过对象检测模型在所述图像中识别出所述目标对象对应的类别和所述目标对象在2CN114973221A权利要求书2/3页所述图像中的位置区域;将根据所述位置区域截取出的目标图像区域输入到文字识别模型,以通过所述文字识别模型识别出至少一组文字识别结果,每组文字识别结果中包括字段位置和字段内容;将所述目标图像区域以及所述至少一组文字识别结果输入到与所述类别对应的板式识别模型,以通过所述板式识别模型输出所述至少一个信息结构体,每个信息结构体中包括字段属性、字段位置和字段内容。9.根据权利要求8所述的方法,其特征在于,所述方法还包括:若通过所述对象检测模型未在所述图像中识别出所述目标对象对应的类别,则