预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN108335266A(43)申请公布日2018.07.27(21)申请号201710241896.6(22)申请日2017.04.14(71)申请人陈思远地址200000上海市虹口区四川北路1831号2号(72)发明人陈思远(51)Int.Cl.G06T5/00(2006.01)G06T7/13(2017.01)G06K9/36(2006.01)G06K9/46(2006.01)G06K9/00(2006.01)权利要求书1页说明书4页附图4页(54)发明名称一种文档图像畸变的矫正方法(57)摘要本发明属于图像处理领域,具体属于对纸质文档(图书,期刊等)的数字化处理中,文档图像畸变的矫正方法。本发明提出了一种纸质文档图像矫正方法。该方法至少包括:对图像进行降采样;对降采样后图像中页面边缘的提取和过滤;基于页面边缘拟合和插值获得页面轮廓;基于轮廓对原图页面进行拉伸和矫正。本发明解决了基于单个二维图像且不依赖于文本行的曲面文档图像畸变矫正的问题。CN108335266ACN108335266A权利要求书1/1页1.一种对文档图像进行矫正的方法,其特征在于该方法至少包括:对图像进行降采样;对降采样后图像中页面边缘的提取和过滤;基于页面边缘拟合和插值获得页面轮廓;基于轮廓对原图页面进行拉伸和矫正。2.根据权利要求1所述的方法,其中,对图像进行降采样的特征是基于像素平均的降采样。3.根据权利要求1所述的方法,其中对降采样后图像中页面边缘的提取和过滤,包含:通过有方向的边缘提取算子从完成降采样之后的图片中获得初步边缘;对边缘进行垂直于该边缘所在轮廓方向的图形腐蚀;通过“类生长”方法对腐蚀后的边缘进行补充和过滤。4.根据权利要求3所述的方法,其中,对边缘进行垂直于该边缘所在轮廓方向的图形腐蚀,其特征是在像素意义上,对于竖直方向的有宽度直线段,只保留水平方向最左侧或最右侧的像素点作为边缘的有效像素;对于水平方向的有宽度直线段,只保留最上端或最下端的像素点作为边缘的有效像素。5.根据权利要求3所述的方法,其中,通过“类生长”方法对腐蚀后的边缘进行补充和过滤包括:对水平方向的边缘的像素点,若“生长”过程从左侧开始,依次判断其右邻域,右上邻域,右下邻域是否为边缘的有效像素。若是,则以该像素重复该过程。若不是,则依次假设其右邻域,右上邻域,右下邻域是边缘的有效像素,然后再对被假设点的右邻域,右上邻域,右下邻域进行判断,若发现边缘的有效像素,则假设有效,基于这个假设重复该过程来完成边缘补充,否则假设无效,过程停止。停止该过程后,对该过程执行的循环次数进行记录,记作曲线段的长度。然后,通过人为设定的阈值,排除低于阈值的曲线段来完成长度过滤。6.根据权利要求1所述的方法,其中,基于页面边缘拟合和插值获得页面轮廓,包含:通过直线拟合方法对页面左侧的边缘和右侧的筛选后边缘进行拟合;通过曲线拟合方法对页面上侧和下侧的筛选后边缘进行拟合;拟合后的直线和曲线,及其交点构成文档页面的轮廓;通过插值改变该轮廓的尺寸,使该轮廓的尺寸符合源文档图像。7.根据权利要求1所述的方法,其中,基于轮廓对原图页面进行拉伸和矫正,包含:通过双线性插值把文档图像轮廓内的区域拉伸到轮廓的外接矩形区域中。通过轮廓上下部分的波动,和高度比例系数,计算出页面的高度。基于页面高度的变化和相对距离导致的缩小,对图像进行水平方向的插值拉伸。2CN108335266A说明书1/4页一种文档图像畸变的矫正方法技术领域:[0001]本发明涉及数字图像处理领域,具体是对纸质文档(图书,期刊等)的数字化处理过程中,文档图像畸变的矫正方法。背景技术:[0002]随着相机的拍摄分辨率不断提升,我们用这些设备对书籍的页面进行拍摄能够取得一个接近扫描分辨率的图像,来进行非接触式扫描。但相机所拍摄的图像中的文档页面几何扭曲的问题,无法通过改变摄像设备的拍摄角度来消除。几何扭曲畸形的存在,将严重影响光学文字识别(OCR),文档页面分割,图像识别等后续信息分析的效果。[0003]为了解决这个扭曲畸形问题,人们提出了多种解决方法,这些方法可以分为基于文本行的矫正方法,通过明暗恢复形状(Shape-From-Shading)的方法,基于页面轮廓的矫正方法,基于多个视点拍摄的多个图像矫正方法,基于主动发射激光束的矫正方法。[0004]基于文本行的矫正方法,分为无模型的方法和有模型的方法。其中,无模型的方法能够对各种扭曲进行矫正,但其矫正精度较差,且可靠性相对低。有模型的方法中,一类方法使用通用柱面模型(GeneralCylinderSurface,GCS),另一类方法使用可展曲面(developablesurface)模型。使用通用柱面模型的方法,只能对