预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共17页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN111783780A(43)申请公布日2020.10.16(21)申请号201911125775.0(22)申请日2019.11.18(71)申请人北京沃东天骏信息技术有限公司地址100176北京市大兴区北京经济技术开发区科创十一街18号院2号楼4层A402室申请人北京京东世纪贸易有限公司(72)发明人谢树雷赖荣凤梅涛(74)专利代理机构中国贸促会专利商标事务所有限公司11038代理人姜雍许蓓(51)Int.Cl.G06K9/34(2006.01)G06N3/08(2006.01)权利要求书3页说明书9页附图4页(54)发明名称图像处理方法、装置及计算机可读存储介质(57)摘要本公开提供了一种图像处理方法、装置及计算机可读存储介质,涉及计算机视觉技术领域。其中的图像处理方法包括:采用预先训练的神经网络对包含单行文字的图像进行处理,得到图像的行特征向量;行特征向量表示图像中各个行像素坐标为图像中单个文字的起始行像素坐标的预测概率以及终止行像素坐标的预测概率;利用行特征向量,确定图像中各个文字的起始行像素坐标以及终止行像素坐标;利用图像中各个文字的起始行像素坐标以及终止行像素坐标,对图像中的各个文字进行分割。本公开能够更加准确的将图像中的文字分割为单个文字,有助于提升文字识别的准确性。CN111783780ACN111783780A权利要求书1/3页1.一种图像处理方法,包括:采用预先训练的神经网络对包含单行文字的图像进行处理,得到所述图像的行特征向量;所述行特征向量表示所述图像中各个行像素坐标为所述图像中单个文字的起始行像素坐标的预测概率以及终止行像素坐标的预测概率;利用所述行特征向量,确定所述图像中各个文字的起始行像素坐标以及终止行像素坐标;利用所述图像中各个文字的起始行像素坐标以及终止行像素坐标,对所述图像中的各个文字进行分割。2.如权利要求1所述的图像处理方法,其中,所述行特征向量包含双通道,所述行特征向量的第一通道为所述图像中各个行像素坐标为所述图像中单个文字的起始行像素坐标的预测概率,所述行特征向量的第二通道为所述图像中各个行像素坐标为所述图像中单个文字的终止行像素坐标的预测概率。3.如权利要求2所述的图像处理方法,还包括:对包含单行文字的训练图像进行标注,得到所述训练图像的训练标签;所述训练标签包含双通道,所述训练标签的第一通道为所述训练图像中各个行像素坐标为所述训练图像中单个文字的起始行像素坐标的标注概率,所述训练标签的第二通道为所述训练图像中各个行像素坐标为所述训练图像中单个文字的终止行像素坐标的标注概率;利用所述训练图像及所述训练标签对所述神经网络进行训练,使得所述神经网络能够对所述图像进行处理,得到所述行特征向量。4.如权利要求3所述的图像处理方法,其中,所述对包含单行文字的训练图像进行标注,得到所述训练图像的训练标签包括:标注所述训练图像中各个文字的起始行像素坐标以及终止行像素坐标;利用所述训练图像中各个文字的起始行像素坐标、终止行像素坐标以及像素宽度,确定所述训练图像中各个行像素坐标为所述训练图像中单个文字的起始行像素坐标的标注概率,以形成所述训练标签的第一通道;利用所述训练图像中各个文字的起始行像素坐标、终止行像素坐标以及像素宽度,确定所述训练图像中各个行像素坐标为所述训练图像中单个文字的终止行像素坐标的标注概率,以形成所述训练标签的第二通道。5.如权利要求4所述的图像处理方法,其中,采用如下方式确定所述训练图像中各个行像素坐标为所述训练图像中单个文字的起始行像素坐标的标注概率:其中,i为所述训练图像中各个文字的序号,C(i)表示所述训练图像中第i个文字的某一行像素坐标,S(i)表示所述训练图像中第i个文字的起始行像素坐标,W(i)表示所述训练图像中第i个文字的像素宽度,Pc(i)表示所述训练图像中行像素坐标C(i)为所述训练图像中第i个文字的起始行像素坐标的标注概率。6.如权利要求5所述的图像处理方法,其中,若某一行像素坐标不属于任何单个文字,则该行像素坐标为所述训练图像中单个文字的起始行像素坐标的标注概率0。7.如权利要求4所述的图像处理方法,其中,采用如下方式确定所述训练图像中各个行2CN111783780A权利要求书2/3页像素坐标为所述训练图像中单个文字的终止行像素坐标的标注概率:其中,i为所述训练图像中各个文字的序号,C(i)表示所述训练图像中第i个文字的某一行像素坐标,E(i)表示所述训练图像中第i个文字的终止行像素坐标,W(i)表示所述训练图像中第i个文字的像素宽度,QC(i)表示所述训练图像中行像素坐标C(i)为所述训练图像中第i个文字的终止行像素坐标的标注概率。8.如权利要求7所述的图像处理方法,其中,若某