一种文本识别方法、装置、电子设备和存储介质-豆柴文库

一种文本识别方法、装置、电子设备和存储介质.pdf

2023-07-24

10金币

579KB

23页

春兰****89

实名认证

内容提供者

1/10

2/10

3/10

4/10

5/10

6/10

7/10

8/10

9/10

10/10

亲，该文档总共23页，到这已经超出免费预览范围，如果喜欢就直接下载吧～

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN114140802A(43)申请公布日2022.03.04(21)申请号202210111519.1(22)申请日2022.01.29(71)申请人北京易真学思教育科技有限公司地址102200北京市昌平区未来科学城英才北三街16号院16号楼401室(72)发明人秦勇(74)专利代理机构北京开阳星知识产权代理有限公司11710代理人张子青(51)Int.Cl.G06V30/40(2022.01)G06V30/19(2022.01)G06K9/62(2022.01)G06N3/04(2006.01)G06N3/08(2006.01)权利要求书3页说明书14页附图5页(54)发明名称一种文本识别方法、装置、电子设备和存储介质(57)摘要本公开涉及一种文本识别方法、装置、电子设备和存储介质。获取目标图像，目标图像包括至少一个字符，通过预先训练的文本识别模型对目标图像中的字符进行识别，文本识别模型包括识别模块和计算模块，其中，通过识别模块对目标图像进行识别，得到目标图像中至少一个字符中每个字符的第一识别结果和目标图像的映射信息；基于计算模块根据第一识别结果和映射信息计算损失值，并根据损失值更新识别模块；通过更新后的识别模块对目标图像进行识别，得到目标图像中至少一个字符中每个字符的第二识别结果，第二识别结果为目标图像的文本识别结果，能够准确的识别图像中的文本，还能够根据目标图像自动调整识别模型的网络参数，识别速度快、准确率高。CN114140802ACN114140802A权利要求书1/3页1.一种文本识别方法，其特征在于，包括：获取目标图像，所述目标图像包括至少一个字符；通过预先训练的文本识别模型对所述目标图像中的字符进行识别，所述文本识别模型包括识别模块和计算模块，其中，通过所述识别模块对所述目标图像进行识别，得到所述目标图像中至少一个字符中每个字符的第一识别结果和所述目标图像的映射信息；基于所述计算模块根据所述第一识别结果和所述映射信息计算损失值，并根据所述损失值更新所述识别模块；通过更新后的识别模块对所述目标图像进行识别，得到所述目标图像中至少一个字符中每个字符的第二识别结果。2.根据权利要求1所述的方法，其特征在于，所述识别模块包括多个识别子模块；所述目标图像的映射信息包括第一映射信息和第二映射信息；所述通过所述识别模块对所述目标图像进行识别，得到所述目标图像中至少一个字符中每个字符的第一识别结果和所述目标图像的映射信息，包括：通过第一识别子模块对所述目标图像进行特征映射，得到第一映射信息；通过第二识别子模块对所述第一映射信息进行特征变换，得到第二映射信息；通过第三识别子模块基于所述第二映射信息，得到所述目标图像中至少一个字符中每个字符的第一识别结果。3.根据权利要求2所述的方法，其特征在于，所述第三识别子模块包括注意力层、循环层和全连接层；所述通过第三识别子模块基于所述第二映射信息，得到所述目标图像中至少一个字符中每个字符的第一识别结果，包括：所述注意力层基于所述第二映射信息，得到第三映射信息；所述循环层基于所述第三映射信息和初始特征向量，得到第一特征向量；所述全连接层基于所述第一特征向量，得到所述目标图像中至少一个字符中每个字符的第一识别结果。4.根据权利要求3所述的方法，其特征在于，所述方法还包括：得到所述第一特征向量后，若不满足所述循环层对应的输出条件，则将所述第一特征向量和所述第三映射信息输入到所述注意力层，得到第四映射信息；将所述第三映射信息与所述第四映射信息合并后的特征信息以及所述第一特征向量输入到所述循环层，得到第二特征向量。5.根据权利要求4所述的方法，其特征在于，所述全连接层基于所述第一特征向量，得到所述目标图像中至少一个字符中每个字符的第一识别结果，包括：得到所述第二特征向量后，若满足所述循环层对应的输出条件，则将所述第二特征向量输入到所述全连接层，得到所述目标图像中至少一个字符中每个字符的第一识别结果。6.根据权利要求1所述的方法，其特征在于，所述计算模块包括多个计算子模块；所述基于所述计算模块根据所述第一识别结果和所述映射信息计算损失值，包括：第一计算子模块基于所述映射信息，得到第一特征信息；第二计算子模块基于所述第一识别结果，得到第二特征信息；第三计算子模块基于预设特征信息，得到第三特征信息；将所述第一特征信息、所述第二特征信息和所述第三特征信息输入到第四计算子模块2CN114140802A权利要求书2/3页计算损失值。7.根据权利要求1所述的方法，其特征在于，所述方法还包括：获取样本图像，并确定所述样本图像中的字符；构建文本识别模型，所述文本识别模型包括识别模块和计算模块；根据所述样本图像以及所述样本图像中的字符对所述识别

相关资料

文本识别方法、装置、电子设备和存储介质.pdf

本公开提供了一种文本识别方法,涉及人工智能技术领域,尤其涉及自然语言处理技术领域。具体实现方案为:基于待识别文本的字形、音标和结构,生成待识别文本的特征序列;根据风险文本的特征序列和待识别文本的特征序列,确定待识别文本和风险文本之间的相似度;以及根据相似度,确定待识别文本的风险程度。本公开还提供了一种文本识别装置、电子设备和存储介质。

2023-05-25

682KB

一种文本识别方法、装置、电子设备和存储介质.pdf

本公开涉及一种文本识别方法、装置、电子设备和存储介质。获取目标图像，目标图像包括至少一个字符，通过预先训练的文本识别模型对目标图像中的字符进行识别，文本识别模型包括识别模块和计算模块，其中，通过识别模块对目标图像进行识别，得到目标图像中至少一个字符中每个字符的第一识别结果和目标图像的映射信息；基于计算模块根据第一识别结果和映射信息计算损失值，并根据损失值更新识别模块；通过更新后的识别模块对目标图像进行识别，得到目标图像中至少一个字符中每个字符的第二识别结果，第二识别结果为目标图像的文本识别结果，能够准确的

2023-07-24

579KB

视频文本的识别方法和装置、存储介质及电子设备.pdf

本发明公开了一种视频文本的识别方法和装置、存储介质及电子设备。其中，该方法包括：获取从待识别的目标视频中提取到的视频文本，其中，视频文本中包括与目标视频的各个视频帧分别对应的帧文本子集；从视频文本中确定出携带有停用词的目标帧文本子集；去除目标帧文本子集中携带的停用词，以将视频文本更新为候选文本；确定候选文本中任意两个视频帧各自对应的帧文本子集中的文本片段之间的编辑距离；根据编辑距离对候选文本进行整合，以得到为目标视频识别出的目标文本。本发明解决了由于文本提取工具忽略视频帧中的部分文字信息所导致的视频文本的

2023-07-25

844KB

一种文本识别方法、装置、电子设备及可读存储介质.pdf

本申请实施例公开了一种文本识别方法、装置、电子设备及可读存储介质，该方法包括：获取包括待识别文本的目标图像；提取目标图像的视觉特征信息和语义特征信息；对视觉特征信息和语义特征信息进行融合处理，得到融合特征信息；通过时序分类算法CTC对融合特征信息进行解码处理，得到待识别文本的目标识别结果。根据本申请的实施例，能够提升文本识别的效率。

2023-07-24

504KB

文本识别方法、装置、电子设备以及存储介质.pdf

本说明书提供文本识别方法、装置、电子设备以及存储介质，其中所述文本识别方法包括：获取多个文本的文本集；提取文本集中文本的主题关键词，并获取从文本集中至少一个文本中提取的实际主题关键词；确定主题关键词在文本集中每个文本的第一分布，以及实际主题关键词在文本集中每个文本的第二分布；将携带第一分布和第二分布的文本集中文本输入分类器进行识别，获得文本集中文本的关键句和非关键句；通过文本识别方法，能够快速准确的获取文本的关键句和非关键句，通过对文本的非关键句进行清洗，方便了对文本的关键句进行标注，提高了知识图谱的构建

2023-11-15

705KB