预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共16页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN107122778A(43)申请公布日2017.09.01(21)申请号201710112654.7(22)申请日2012.11.26(62)分案原申请数据201210486972.72012.11.26(71)申请人阿里巴巴集团控股有限公司地址英属开曼群岛大开曼资本大厦一座四层847号邮箱(72)发明人郑琪王永攀(74)专利代理机构北京集佳知识产权代理有限公司11227代理人陈莎莎王宝筠(51)Int.Cl.G06K9/34(2006.01)权利要求书2页说明书9页附图4页(54)发明名称一种单字区域的合并方法和装置(57)摘要本发明实施例公开了单字区域的合并方法和装置。其中,该方法包括:提取图像中的连通分量,对所述连通分量进行合并,得到合并过程产生的多个合并区域;排列所述合并区域,得到至少一个文字行;统计所述文字行包含的合并区域的个数,保留包含所述合并区域的个数最多的最大文字行,并删除与之重叠的其他文字行,其中,所述最大文字行中所包含的所述合并区域为所述单字区域。根据本发明实施例,可以解决现有技术中的合并不准确问题。CN107122778ACN107122778A权利要求书1/2页1.一种单字区域的合并方法,其特征在于,包括:对图像中的连通分量进行合并,得到合并区域;根据所述合并区域确定出合并正确的单字区域;其中,所述合并正确的单字区域为连通分量个数最多的文字行中的合并区域。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:对所有合并区域进行文字行排列分析,得到文字行;根据所述合并区域确定出合并正确的单字区域,包括:从文字行中选择连通分量个数最多的文字行,将连通分量个数最多的文字行中的合并区域作为合并正确的单字区域。3.根据权利要求1所述的方法,其特征在于,所述图像中包括相邻的多行文字;对图像中的连通分量进行合并,包括:对图像中的相邻的多行文字的连通分量进行合并;所述合并正确的单字区域包括:正确合并的行中的单字区域。4.根据权利要求1所述的方法,其特征在于,若多个合并区域包含相同的连通分量,所述合并正确的单字区域为连通分量个数最多的合并区域。5.根据权利要求2所述的方法,其特征在于,从文字行中选择连通分量个数最多的文字行,将连通分量个数最多的文字行中的合并区域作为合并正确的单字区域,包括:统计文字行中包含的合并区域的个数,保留包含合并区域的个数最多的最大文字行,并删除与之重叠的其他文字行,其中,所述最大文字行中所包含的合并区域为合并正确的单字区域。6.根据权利要求5所述的方法,其特征在于,所述方法还包括:如果除所述最大文字行和与所述最大文字行重叠的文字行之外还有剩余的文字行,从所述剩余的文字行中继续保留下一个最大文字行,并删除与之重叠的其他文字行,以此类推,直到无最大文字行可保留为止;其中,每次保留的最大文字行中所包含的合并区域为合并正确的单字区域。7.根据权利要求1所述的方法,其特征在于,对图像中的连通分量进行合并,得到合并区域,包括:提取图像中的连通分量,对所述连通分量进行合并,得到合并过程产生的多个合并区域。8.根据权利要求7所述的方法,其特征在于,所述提取图像中的连通分量,对所述连通分量进行合并,得到合并过程产生的多个合并区域,包括:对提取的连通分量进行两两比较,将符合包围结构关系和相邻结构关系的任意两个连通分量进行合并,得到合并区域;将连通分量和合并过程产生的所述合并区域作为合并对象,重复对合并对象进行两两比较,将符合包围结构关系和相邻结构关系的任何两个合并对象进行合并,直到不能合并为止。9.根据权利要求8所述的方法,其特征在于,所述将符合包围结构关系和相邻结构关系的任意两个连通分量进行合并,包括:判断两个连通分量的拟合矩形之间的重叠面积与两个连通分量的拟合矩形中面积最小的拟合矩形面积的比值是否大于第一预设倍数,以及两个连通分量的颜色和笔划宽度是2CN107122778A权利要求书2/2页否接近,如果是,符合包围结构关系,否则,不符合包围结构关系;判断两个连通分量的拟合矩形的宽度和与中心距离之间的比值是否大于第二预设倍数,两个连通分量的颜色和笔划是否接近,以及合并后的区域的拟合矩形的长度与宽度的比值是否小于第三预设倍数,如果是,符合相邻结构关系,否则,不符合相邻结构关系。10.根据权利要求8所述的方法,其特征在于,所述将符合相邻结构关系的两个合并对象进行合并,包括:判断两个合并对象的拟合矩形之间的重叠面积与两个合并对象的拟合矩形中面积最小的拟合矩形面积的比值是否大于第一预设倍数,以及两个合并对象的颜色和笔划宽度是否接近,如果是,符合包围结构关系,否则,不符合包围结构关系;判断两个合并对象的拟合矩形的宽度和与中心距离之间的比值是否