预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共28页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号(10)申请公布号CNCN104182744104182744A(43)申请公布日2014.12.03(21)申请号201310196315.3(22)申请日2013.05.24(71)申请人佳能株式会社地址日本东京(72)发明人麻文华罗兆海(74)专利代理机构中国国际贸易促进委员会专利商标事务所11038代理人袁玥(51)Int.Cl.G06K9/20(2006.01)G06K9/46(2006.01)权权利要求书5页利要求书5页说明书11页说明书11页附图11页附图11页(54)发明名称文本检测方法和装置以及文本信息提取方法和系统(57)摘要本发明涉及一种文本检测方法和装置以及文本信息提取方法和系统。提供了一种用于检测包括至少一个连通体(CC)的图像中的文本区域的方法。该方法包括:文本背景区域检测(TBR)步骤,用于从所述图像中检测至少一个TBR;CC过滤步骤,用于对所述至少一个CC进行过滤以保留至少一个候选文本CC;和CC组合步骤,用于基于TBR检测步骤中检测出的TBR,组合所述至少一个候选文本CC以形成至少一个CC组,并且基于所述至少一个CC组生成至少一个文本区域。根据本发明的方法可以快速地和/或精确地指出图像中的文本位置,从而改进文本检测的性能。CN104182744ACN104827ACN104182744A权利要求书1/5页1.一种文本检测方法,所述文本检测方法用于检测包括至少一个连通体的图像中的文本区域,所述方法包括:文本背景区域检测步骤(310),用于从所述图像中检测文本背景区域;连通体过滤步骤(320),用于对所述至少一个连通体进行过滤,以保留至少一个候选文本连通体;和连通体组合步骤(330),用于基于文本背景区域检测步骤中检测出的文本背景区域,组合所述至少一个候选文本连通体以形成至少一个连通体组,并且基于所述至少一个连通体组生成至少一个文本区域。2.如权利要求1所述的方法,其中所述文本背景区域是所述图像中的文本的周围区域,并且具有规则的边界以及均匀颜色或灰度。3.如权利要求1或2所述的方法,其中文本背景区域检测步骤(310)包括基于以下至少之一从所述至少一个连通体中选择文本背景区域:所述至少一个连通体的特征;所述至少一个连通体内的成员连通体的统计信息,其中成员连通体是位于所述至少一个连通体的边界内、且相对于所述至少一个连通体具有高对比度的连通体;和所述至少一个连通体与其它文本背景区域之间的关系。4.如权利要求3所述的方法,其中所述至少一个连通体的特征包括以下至少一项:连通体的颜色或灰度均匀性、连通体的大小、连通体的形状、连通体的边界规则度、连通体在图像中的位置、连通体的平均灰度值,和连通体的灰度值分布。5.如权利要求3所述的方法,其中,所述成员连通体的统计信息包括以下至少一项:所述连通体内的成员连通体的数量;所述成员连通体中文本置信度高于第一预定义阈值的种子连通体的数量;所述连通体内的成员连通体的平均文本置信度;和所述连通体内的成员连通体的总面积与所述连通体的面积之比。6.如权利要求3所述的方法,其中,基于所述至少一个连通体与其它文本背景区域之间的关系来从所述至少一个连通体中选择文本背景区域包括:响应于该连通体不是先前已确定的文本背景区域内的成员连通体并且与该先前已确定的文本背景区域不包含相同的成员连通体,将该连通体确定为文本背景区域。7.如权利要求1或2所述的方法,其中,在所述连通体过滤步骤(320)中,对不处于任何文本背景区域的边界内的连通体的过滤比对处于文本背景区域的边界内的连通体的过滤更严格。8.如权利要求1所述的方法,其中,在所述连通体过滤步骤(320)中,基于以下各项中的至少一项对处于文本背景区域的边界内的连通体和不处于任何文本背景区域的边界内的连通体进行过滤:连通体的大小;连通体的形状;连通体的最小外接框的宽高比;连通体与其最小外接框的面积比;连通体的周长与面积之比;以及2CN104182744A权利要求书2/5页连通体的纹理特征。9.如权利要求8所述的方法,其中进一步基于以下各项中的至少一项对不处于任何文本背景区域内的连通体进行过滤:笔划宽度统计信息;以及连通体边界的像素数与该连通体的像素数之比。10.如权利要求1或2所述的方法,所述连通体组合步骤(330)进一步包括:a)将所述候选文本连通体分配到各个文本背景区域中并且将不能分配到文本背景区域中的连通体分配到外部区域中(610);b)将每个文本背景区域和所述外部区域中的连通体各自组合在一起以形成连通体组(620);和c)将来自每个文本背景区域和所述外部区域中的不同区域的连通体组结合在一起以生成所述至少一个文本区域(630)。11.如权利要求10所述的方法,所述步骤b