预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共26页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利(10)授权公告号CN104182722B(45)授权公告日2018.05.18(21)申请号201310196300.7(56)对比文件(22)申请日2013.05.24CN101266654A,2008.09.17,US2009/0263025A1,2009.10.22,(65)同一申请的已公布的文献号YasuhiroKunishige等.Scenery申请公布号CN104182722ACharacterDetectionwithEnvironmental(43)申请公布日2014.12.03Context.《2011InternationalConferenceon(73)专利权人佳能株式会社DocumentAnalysisandRecognition》.2011,地址日本东京-1053页.(72)发明人麻文华罗兆海审查员倪赛华(74)专利代理机构中国国际贸易促进委员会专利商标事务所11038代理人陈新(51)Int.Cl.G06K9/00(2006.01)权利要求书4页说明书9页附图12页(54)发明名称文本检测方法和装置以及文本信息提取方法和系统(57)摘要本公开涉及文本检测方法和装置以及文本信息提取方法和系统。提供了用于检测包括至少一个连通体(CC)的图像中的文本区域的方法。该方法包括:文本背景区域(TBR)检测步骤,用于从图像中检测至少一个TBR;CC过滤步骤,用于基于检测到的TBR对所述至少一个CC进行过滤以保留至少一个候选文本CC;和CC组合步骤,将所述至少一个候选文本CC进行组合以得到文本区域。根据本发明的方法可以快速地和/或精确地指出图像中的文本位置,从而改进文本检测的性能。CN104182722BCN104182722B权利要求书1/4页1.一种文本检测方法,用于检测具有至少一个连通体的图像中的文本区域,所述方法包括:文本背景区域检测步骤,用于从所述图像中检测至少一个文本背景区域,所述至少一个文本背景区域包括文本的背景区域的特征;连通体过滤步骤,用于基于检测到的文本背景区域对所述至少一个连通体进行过滤,以保留至少一个候选文本连通体;和连通体组合步骤,用于将所述至少一个候选文本连通体进行组合以得到文本区域,其中,在过滤时,位于文本背景区域中的连通体比不位于文本背景区域中的连通体更有可能被保留为候选文本连通体。2.如权利要求1所述的方法,其中,文本背景区域是图像中的文本周围的区域,并且具有规则的边界以及均匀的颜色或灰度。3.如权利要求1或2所述的方法,其中文本背景区域检测步骤包括基于以下至少之一从所述至少一个连通体中选择文本背景区域:所述至少一个连通体的特征;所述至少一个连通体内的成员连通体的统计信息,其中成员连通体是位于所述至少一个连通体的边界内、且相对于所述至少一个连通体具有高对比度的连通体;和所述至少一个连通体与其它文本背景区域之间的关系。4.如权利要求3所述的方法,其中所述至少一个连通体的特征包括以下至少一项:连通体的颜色或灰度均匀性、连通体的大小、连通体的形状、连通体的边界规则度、连通体在图像中的位置、连通体的平均灰度值、和连通体的灰度值分布。5.如权利要求3所述的方法,其中,所述成员连通体的统计信息包括以下至少一项:所述连通体内的成员连通体的数量;所述成员连通体中文本置信度高于第一预定义阈值的种子连通体的数量;所述连通体内的成员连通体的平均文本置信度;和所述连通体内的成员连通体的总面积与所述连通体的面积之比。6.如权利要求3所述的方法,其中,基于所述至少一个连通体与其它文本背景区域之间的关系来从所述至少一个连通体中选择文本背景区域包括:响应于连通体不是先前已确定的文本背景区域内的成员连通体并且与该先前已确定的文本背景区域不包含相同的成员连通体,将该连通体确定为文本背景区域。7.如权利要求1所述的方法,其中,连通体过滤步骤包括:计算所述至少一个连通体中除文本背景区域以外的每一个连通体的文本置信度,其中,在计算文本置信度时,对位于任何文本背景区域的边界内的连通体赋予比其它连通体更高的权重;以及将文本置信度高于第二预定义阈值的连通体确定为候选文本连通体。8.如权利要求1所述的方法,其中,连通体过滤步骤包括:对于所述至少一个连通体中除文本背景区域以外的每一个连通体,响应于该连通体位于任何文本背景区域的边界内,将该连通体标识为第一连通体,否则,将该连通体标识为第二连通体;对于第一连通体和第二连通体中的每个连通体执行第一过滤步骤,以确定该连通体是2CN104182722B权利要求书2/4页否为候选文本连通体;以及对于被第一过滤步骤确定为候选文本连通体的每个第二连通体执行第二过滤步骤,以进一步确定该第二连通体是否为候选文本连通体。9.如权利要求8所述的方法,