预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共31页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN115984888A(43)申请公布日2023.04.18(21)申请号202310023575.4G06N3/08(2023.01)(22)申请日2023.01.06(71)申请人北京百度网讯科技有限公司地址100085北京市海淀区上地十街10号百度大厦2层(72)发明人于海鹏李煜林钦夏孟姚锟(74)专利代理机构中科专利商标代理有限责任公司11021专利代理师杨静(51)Int.Cl.G06V30/414(2022.01)G06V30/19(2022.01)G06V30/148(2022.01)G06V10/82(2022.01)G06N3/0464(2023.01)权利要求书3页说明书18页附图9页(54)发明名称信息生成方法、信息处理方法、装置、电子设备以及介质(57)摘要本公开提供了一种信息生成方法、信息处理方法、装置、电子设备以及介质,涉及人工智能技术领域,尤其涉及深度学习技术、图像处理技术和计算机视觉技术领域,可应用于OCR光学字符识别等场景。具体实现方案为:对文本图像进行文本检测,得到检测信息,其中,检测信息包括第一检测信息和第二检测信息,第一检测信息包括多个第一文本区域各自的类别信息和第一位置信息,第二检测信息包括至少一个第二文本区域各自的第二位置信息;根据第一位置信息和文本图像,获取与多个第一文本区域各自对应的文本区域图像;对文本区域图像进行文本识别,得到识别信息;根据类别信息、第二检测信息和识别信息,生成文本图像的结构化信息。CN115984888ACN115984888A权利要求书1/3页1.一种信息生成方法,包括:对文本图像进行文本检测,得到检测信息,其中,所述检测信息包括第一检测信息和第二检测信息,所述第一检测信息包括多个第一文本区域各自的类别信息和第一位置信息,所述第二检测信息包括至少一个第二文本区域各自的第二位置信息,所述第二文本区域包括所述类别信息满足预定条件的两个所述第一文本区域;根据所述第一位置信息和所述文本图像,获取与所述多个第一文本区域各自对应的文本区域图像;对所述文本区域图像进行文本识别,得到识别信息,其中,所述识别信息包括多个所述文本区域图像各自的文本识别信息;以及根据所述类别信息、所述第二检测信息和所述识别信息,生成所述文本图像的结构化信息。2.根据权利要求1所述的方法,其中,所述对文本图像进行文本检测,得到检测信息,包括:对所述文本图像进行特征提取,得到至少一个尺度的第一特征图;根据所述至少一个尺度的第一特征图,获取第二特征图;根据所述至少一个尺度的第一特征图,获取第三特征图;根据所述第二特征图,获取所述第一检测信息;以及根据所述第三特征图,获取所述第二检测信息。3.根据权利要求2所述的方法,其中,所述根据所述第三特征图,获取所述第二检测信息,包括:将所述第二特征图和所述第三特征图进行融合,得到融合特征图;以及根据所述融合特征图,获取所述第二检测信息。4.根据权利要求2或3所述的方法,其中,所述对所述文本图像进行特征提取,得到至少一个尺度的第一特征图,包括:对所述文本图像进行M个阶段的特征提取,得到与第M阶段对应的至少一个第一特征图;以及根据与所述第M阶段对应的至少一个第一特征图,得到所述至少一个尺度的第一特征图;其中,第m阶段具有Tm个并联层级,同一并联层级的第一特征图的图像分辨率相同,不同并联层级的第一特征图的图像分辨率不同;其中,M是大于1或等于1的整数,m是大于或等于1且小于或等于M的整数,Tm是大于或等于1的整数。5.根据权利要求4所述的方法,其中,在M是大于1的整数的情况下,所述对所述文本图像进行M个阶段的特征提取,得到与第M阶段对应的至少一个第一特征图,包括:对与第m‑1阶段对应的至少一个第一特征图进行卷积处理,得到与第m阶段对应的至少一个中间特征图;以及对与所述第m阶段对应的至少一个中间特征图进行特征融合,得到与第m阶段对应的至少一个第一特征图;其中,m是大于1且小于或等于M的整数。2CN115984888A权利要求书2/3页6.根据权利要求5所述的方法,其中,所述对与所述第m阶段对应的至少一个中间特征图进行特征融合,得到与第m阶段对应的至少一个第一特征图,包括:针对所述Tm个并联层级中的第i个并联层级,根据与所述第i个并联层级对应的其他中间特征图和与所述第i个并联层级对应的中间特征图,得到与所述第i个并联层级对应的第一特征图;其中,与所述第i个并联层级对应的其他中间特征图是与所述Tm个并联层级中除所述第i个并联层级以外的至少部分并联层级对应的中间特征图,i是大于或等于1且小于或等于Tm的整数。7.根据权利要求2或3所述的方法,其中,所述对所述文本图像进行特征提取,得到至少一个尺度的第一特征图,包括: