预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共28页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN111553344A(43)申请公布日2020.08.18(21)申请号202010303874.X(22)申请日2020.04.17(71)申请人携程旅游信息技术(上海)有限公司地址201203上海市浦东新区张江高科技园区碧波路518号302室(72)发明人黄登周源(74)专利代理机构上海弼兴律师事务所31283代理人薛琦林嵩(51)Int.Cl.G06K9/32(2006.01)G06K9/34(2006.01)G06K9/46(2006.01)G06T7/13(2017.01)G06T7/136(2017.01)权利要求书3页说明书14页附图10页(54)发明名称文本图像的倾斜校正方法、系统、设备和存储介质(57)摘要本发明公开了一种文本图像的倾斜校正方法、系统、设备和存储介质,方法包括:对文本图像利用边缘检测算法获取二值图像;提取二值图像的所有轮廓,轮廓包括第一轮廓和第二轮廓,第一轮廓内包含多个第二轮廓;利用轮廓特征寻找符合预设的边缘轮廓,获取边缘轮廓及内部的第二轮廓的角度集合,并根据角度集合计算出倾斜角度;若不存在边缘轮廓,利用自适应霍夫变换筛选出所有线段并求出角度集合,再利用聚类算法求出倾斜角度;根据倾斜角度对文本图像进行倾斜校正。本发明结合文本图像的特征,根据边缘轮廓及霍夫直线检测并结合聚类算法计算图像的倾斜角度,可以准确快速的获得文本图像的倾斜角度并进行倾斜校正,提高了文本图像倾斜校正的准确率。CN111553344ACN111553344A权利要求书1/3页1.一种文本图像的倾斜校正方法,其特征在于,包括:获取文本图像的二值图像;获取所述二值图像中的所有轮廓,所述轮廓包括第一轮廓和第二轮廓,所述第一轮廓内包括若干个所述第二轮廓,所述第二轮廓为所述二值图像中单个文字对应的轮廓;判断所述第一轮廓是否符合预设边缘轮廓的条件,若符合,则获取所述第一轮廓的第一倾斜角度和所述第一轮廓中所述第二轮廓的第二倾斜角度集合;根据所述第一倾斜角度和所述第二倾斜角度集合计算得到所述文本图像的目标倾斜角度;根据所述目标倾斜角度对所述文本图像进行倾斜校正。2.如权利要求1所述的文本图像的倾斜校正方法,其特征在于,所述判断所述第一轮廓是否符合预设边缘轮廓的条件的步骤包括:对所述第一轮廓进行遍历;判断所述第一轮廓是否符合预设边缘轮廓的条件;所述预设边缘轮廓的条件包括:所述第一轮廓的四条边连续且至少有三个交点、获取的所述第一轮廓内的每个所述第二轮廓的倾斜角度与所述第一轮廓的倾斜角度相差小于预设角度值,和获取的所述第一轮廓内的所述第二轮廓的数量大于预设数量值。3.如权利要求1所述的文本图像的倾斜校正方法,其特征在于,所述获取文本图像的二值图像的步骤包括:对所述文本图像进行预处理以得到第一图像;获取所述第一图像的亮度平均值和标准差;设置第一参数,所述第一参数可动态调整;根据所述亮度平均值、所述标准差和所述第一参数计算得到第一阈值和第二阈值;根据所述第一阈值和所述第二阈值使用边缘检测算法对所述第一图像进行边缘检测得到所述二值图像。4.如权利要求1所述的文本图像的倾斜校正方法,其特征在于,所述获取所述二值图像中的所有轮廓,所述轮廓包括第一轮廓和第二轮廓,所述第一轮廓内包括若干个所述第二轮廓,所述第二轮廓为所述二值图像中单个文字对应的轮廓的步骤具体包括:使用寻找轮廓函数计算得到所述二值图像中的所有轮廓;计算得到所有所述轮廓的最小外接矩形;计算得到所有所述最小外接矩形的第一平均高度、第一平均宽度和平均面积;采用聚类算法筛选出在第一预设范围内的所述第一平均高度和第一平均宽度,并根据筛选后的所述第一平均高度和第一平均宽度重新计算得到第二平均高度和第二平均宽度;根据所述第二平均高度和所述第二平均宽度获取文本平均高度;根据所述文本平均高度设置面积阈值;获取所述轮廓中面积值大于所述面积阈值的轮廓作为第二轮廓,所述第二轮廓包括所述二值图像中单个文字的轮廓;获取所述第二轮廓的最大外接矩形;根据所述平均面积、所述最大外接矩形及所述文本平均高度值获取包含若干所述第二轮廓的所述第一轮廓。2CN111553344A权利要求书2/3页5.如权利要求4所述的文本图像的倾斜校正方法,其特征在于,在所述第一轮廓不符合预设边缘轮廓的条件时,所述倾斜校正方法还包括:根据最大外接矩形和文本平均高度值获取霍夫变换算法对应的设定参数阈值;采用霍夫变换算法根据设定参数阈值对所述二值图像进行直线检测得到直线线段;利用反正切函数获取所有所述直线线段的第一角度;将每个所述第一角度转换为预设角度范围内以形成第三角度集合;使用聚类算法获取所述第三角度集合中的最优角度集合;根据所述最优角度集合计算得到平均倾斜角度集合;判断所述平均