预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共13页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN106096610A(43)申请公布日2016.11.09(21)申请号201610421725.7(22)申请日2016.06.13(71)申请人湖北工业大学地址430068湖北省武汉市武昌区南湖李家墩1村1号(72)发明人熊炜赵诗云徐晶晶赵楠刘敏王改华李敏刘小镜吴俊驰(74)专利代理机构武汉科皓知识产权代理事务所(特殊普通合伙)42222代理人魏波(51)Int.Cl.G06K9/38(2006.01)G06K9/62(2006.01)权利要求书3页说明书8页附图1页(54)发明名称一种基于支持向量机的文档图像二值化方法(57)摘要本发明公开了一种基于支持向量机的文档图像二值化方法,包括彩色图像灰度化、文档图像分块、提高图像块的局部对比度、特征参数提取、SVM阈值分类、图像块拼接、笔画宽度估计、局部二值化等八个步骤;本发明采用最小均值法对彩色图像进行灰度化,所得灰度图像具有彩色无关性;定义的局部对比度,不仅能够补偿图像亮度变化产生的影响,还综合考虑了图像邻域内所有像素对图像局部对比度的归一化贡献;采用SVM阈值分类法准确性高,可靠性高;采用逐行扫描法进行笔画宽度估计,对文档图像分辨率变化具有较好的鲁棒性;本发明能够较好地保留字符笔画细节,并在有效分割字符前景的同时,较好地抑制墨迹浸润、页面污渍、纹理背景及光照不均等现象。CN106096610ACN106096610A权利要求书1/3页1.一种基于支持向量机的文档图像二值化方法,其特征在于,包括以下步骤:步骤1:判断文档图像是否为彩色图像;若是,则对彩色图像进行灰度化处理,然后执行下述步骤2;若否,则继续执行下述步骤2;步骤2:对文档图像进行分块;对于每幅文档图像按照N×N的大小进行分块,这样每幅图片都被分成了N2块图像区域,N≥5;所述N2块图像区域包含了三种不同类型:①只含有背景,没有任何前景文本信息;②文本前景和复杂背景融合较好,其各自占图像块比例约为50%;③文本前景占图像块比例小于10%,图像中的其他部分都是复杂的背景区域;步骤3:提高图像块的局部对比度;步骤4:图像块的特征参数提取;步骤5:SVM阈值分类模型训练,包括以下子步骤:步骤5.1:将步骤3中每个经过局部对比度增强后的图像块分别以T0、TOtsu和Tmin作为阈值进行粗分割,分割的结果分开存储;对于步骤2中所述第①种情况,直接将阈值取为0,记为T=0,这样背景区域会变成全白而前景文本全黑;对于步骤2中所述第②种情况,将阈值取为该图像块的Otsu最佳阈值,记为TOtsu;对于步骤2中所述第③种情况,将阈值设定为该块周边图像块中Otsu阈值的最小值,记为Tmin;步骤5.2:将每幅图像的标准GT图像都也按照相同大小进行N×N分块,分别将T0、TOtsu和Tmin分割后的结果图和它对应的标准GT图像块进行对比,选取三种指标作为参考,即:F值(F-measure)、峰值信噪比(PSNR)、结构相似度(SSIM),分别输出对应二值化图像的参数评估数值表;步骤6:图像块拼接;步骤7:笔画宽度估计;步骤8:局部二值化。2.根据权利要求1所述的基于支持向量机的文档图像二值化方法,其特征在于,步骤1中所述对彩色图像进行灰度化处理,是采用最小均值法对彩色文档图像f(x,y)进行灰度化处理,所得灰度图像具有彩色无关性,计算公式为:其中fi(x,y)分别为R、G、B三种颜色的分量图像,i可取R、G、B三个分量,fgray(x,y)为变换后的灰度图像。3.根据权利要求1所述的基于支持向量机的文档图像二值化方法,其特征在于,步骤3中所述提高图像块的局部对比度,其计算公式为:其中fmax(x,y)、fmin(x,y)和fmean(x,y)分别表示图像在以(x,y)为中心的3×3邻域内的亮度最大值、最小值和平均值;为了不使分母为0,ε是无限趋近于零的值。2CN106096610A权利要求书2/3页4.根据权利要求1所述的基于支持向量机的文档图像二值化方法,其特征在于,步骤4中所述图像块的特征参数包括均值μ、标准差σ、相对平滑度R、三阶矩u3(x)、一致性U(x)、熵e(x)、TOtsu、TOtsu-Tmin、灰度信息、u、deta;其计算公式分别为:反应图像的平均灰度;反应灰度级的变化程度,即图像粗糙程度的质量;R=1-1/(1+σ2),反应了图像块的平滑性;用于确定图像直方图的对称性;反应图像的均匀程度;表示图像的复杂程度和均匀程度;TOtsu,使用Otsu算法计算出来的分割阈值;TOtsu-Tmin,Tmin为该块邻域Otsu阈值的最小值;灰度信息:灰度分级信息,反应图像均匀程度;其中:L表示图像灰度级分辨率,i∈[0,L-1]表示图像灰度级取值,xi表