基于图像的文本识别方法、装置、电子设备及介质.pdf
小寄****淑k
亲,该文档总共21页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
基于图像的文本识别方法、装置、电子设备及介质.pdf
本说明书实施例公开了一种基于图像的文本识别方法,获取包含有文本数据的图像;使用轻量级卷积神经网络对所述图像进行特征提取,得到特征图;根据在高度方向上拆分所述特征图得到的高度序列特征图集,获取序列化特征;对所述序列化特征进行文本识别,得到识别结果;由于轻量级CNN采用了采用深度可分离卷积,能够较小计算量提高计算速度并降低内存使用率;以及序列化特征中包含了高度方向的特征向量,在保留了原有高度方向的特征向量的情况下,使得保留的原有特征更多,在保留的原有特征越多的基础上,其识别的准确率也会随之提高;如此,能够在减
基于文本图像的识别方法、装置、设备和介质.pdf
本申请涉及一种基于文本图像的识别方法、装置、设备和介质。所述方法包括:获取待识别的文本图像;将文本图像输入至分割模型的编码结构,通过编码结构中的至少一个的编码单元依次对文本图像进行编码处理,得到与文本图像对应的第一特征图;其中,编码结构中包括至少一个的可变形卷积;获取各编码单元在编码处理的过程中分别产生的中间编码特征图;通过分割模型中的解码结构,并根据各中间编码特征图对第一特征图进行解码处理,得到对应的第二特征图;根据第二特征图进行像素级分类处理,以识别文本图像中的文本。采用本方法能够提高提取特征图的精准
文本识别方法、装置、介质及电子设备.pdf
本公开涉及人工智能和图像识别领域,揭示了一种文本识别方法、装置、介质及电子设备。该方法包括:获取待识别图片;对所述待识别图片进行文本检测,得到包含目标文本的文本区域图像;将所述文本区域图像进行分割,得到多个文本子区域图像;利用第一文本识别模型对各个所述文本子区域图像分别进行识别,得到各所述文本子区域图像分别对应的文本识别内容;根据各所述文本子区域图像分别对应的文本识别内容,生成所述待识别图片对应的目标识别结果。此方法下,大大降低了单个识别区域的大小,减少了识别区域中包含的信息量,可以大幅度提升模型识别准确
基于文本生成图像的方法、装置、电子设备和介质.pdf
本公开提供了一种基于文本生成图像的方法、装置、电子设备和介质,涉及知识图谱、自然语言处理等人工智能技术领域,可应用于智能创作、智慧政务等场景。实现方案为:获取第一文本,并基于多种规则对第一文本进行扩充以得到多个第二文本,其中,多种规则用于在不同维度上对第一文本进行扩充;基于多个第二文本生成对应的多个图像;对第一文本进行编码,以确定第一文本对应的第一向量;对多个图像中的每一个图像进行编码,以确定每一个图像对应的第二向量,其中,第一向量和每一个图像对应的第二向量位于同一语义空间;以及基于第一向量和每一个图像对
图像中的文本识别方法、装置、设备及存储介质.pdf
本公开涉及一种图像中的文本识别方法、装置、设备及存储介质。本公开通过获取目标图像,并确定该目标图像中包含至少一行文本的子图像。进一步,将所述子图像、以及所述至少一行文本中的每个字符输入多模态模型,由于子图像含有较为直观且准确的信息,从而使得多模态模型的输入中增加了原始视觉信息,使得多模态模型可以根据子图像对文本标注任务进行增强和指导,从而使得多模态模型可以确定出每个字符较为准确的标签。进一步,根据每个字符的标签可以对该至少一行文本进行准确的断句,尤其是对有歧义的文本行的断句处理效果较好,避免将图像中的多段