预览加载中,请您耐心等待几秒...
1/9
2/9
3/9
4/9
5/9
6/9
7/9
8/9
9/9

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN107480700A(43)申请公布日2017.12.15(21)申请号201710583981.0(22)申请日2017.07.18(71)申请人西安理工大学地址710048陕西省西安市金花南路5号(72)发明人张九龙郭铭涛屈小娥(74)专利代理机构西安弘理专利事务所61214代理人韩玙(51)Int.Cl.G06K9/62(2006.01)G06K9/46(2006.01)权利要求书3页说明书5页(54)发明名称一种基于Gabor和SVM纹理提取汉字的方法(57)摘要本发明公开了一种基于Gabor和SVM纹理提取汉字的方法,首先选取g个训练样本和m个待评价样本,分别对g个训练样本和m个待评价样本字体图像进行灰度化处理,对Gabor滤波器进行参数设置,得到五个尺度、四个方向共二十个滤波图像,然后将得到的滤波图像分别与得到的灰度化处理后的图像进行卷积,计算图像的均值和方差,将计算结果组成特征向量,最后根据训练样本预测待评价样本,进行保留或者淘汰,本发明解决了现有技术中存在的汉字书写规范程度评价困难的问题。CN107480700ACN107480700A权利要求书1/3页1.一种基于Gabor和SVM纹理提取汉字的方法,其特征在于,具体按照以下步骤实施:步骤1、选取g个训练样本和m个待评价样本;步骤2、分别对g个训练样本和m个待评价样本字体图像进行灰度化处理,处理后训练样本图像记为Wx,x=1,2,…,g,g≥50,待评价样本的图像记为Wt’,t=1,2,…,m,m为待评价样本个数;步骤3、对Gabor滤波器进行参数设置,得到五个尺度、四个方向共二十个滤波图像;步骤4、将步骤3得到的滤波图像分别与步骤2得到的灰度化处理后的图像进行卷积;步骤5、计算步骤4得到的图像的均值和方差,将计算结果组成特征向量;步骤6、根据训练样本预测待评价样本;步骤7、根据步骤6的预测结果,如果当前书法字体预测结果为优秀的则保留,否则淘汰。2.根据权利要求1的一种基于Gabor和SVM纹理提取汉字的方法,其特征在于,所述步骤1具体为:从北京大学的CHAED字库中根据人工打分划分为优秀、一般的字体样本中选取g个作为训练样本,任意选取m个要进行评判的书法字体作为待评价样本。3.根据权利要求1的一种基于Gabor和SVM纹理提取汉字的方法,其特征在于,所述步骤3具体为:对Gabor滤波器进行参数设置,其中,(x,y)表示Gabor滤波器的空间坐标,γ为空间纵横比,γ∈(0,1),θ为Gabor滤波器旋转角度,σ为高斯标准差,f为空间尺度,为相位偏移,设Gabor核窗口为图像窗口的1/2,由于汉字基本笔画为横、竖、撇、捺,对应Gabor滤波器旋转角度θ的四个方向,所以设θ1=0,θ2=π/4,θ3=π/2,θ4=3π/4,已知高斯标准差σ和空间-k尺度f的关系为σf=0.56,尺度f的变化公式为fk=a*fmax,k=0,…,4,且已知fmax=0.22,由此可以确定五个尺度fk,k=0,…,4,由σ和f的关系式σf=0.56和已经确定的五个尺度fk,k=0,…,4能得到对应的五个高斯标准差σk,k=0,…,4,由于相位偏移本方法取0,综上确定的参数,能得到五个尺度、四个方向共二十个Gabor图像,记为Gk,k=1,2,…,20。4.根据权利要求1所述的一种基于Gabor和SVM纹理提取汉字的方法,其特征在于,所述步骤4具体为:将步骤3得到的二十个Gabor滤波器图像Gk,k=1,2,…,20与步骤2得到的g个训练样本图像Wx,x=1,2,…,g,以及m个待评价样本图像Wt’,t=1,2,…,m依次进行卷积,二十个Gabor滤波器图像Gk,k=1,2,…,20与训练样本字体图像Wx,x=1,2,…,g进行卷积如下:2CN107480700A权利要求书2/3页p,q满足条件0≤p<Mr+Nr-1,0≤q<Mc+Nc-1,(p,q)为卷积图像每个像素点的坐标,Mr、Mc分别为训练样本字体图像Wx,x=1,2,…,g窗口的的高和宽,Nr、Nc分别为Gabor滤波器图像Gk的高和宽;二十个Gabor滤波器图像Gk,k=1,2,…,20与待评价样本字体图像Wt’,t=1,2,…,m进行卷积:p′,q′满足条件0≤p′<Mr′+Nr′-1,0≤q′<Mc′+Nc′-1,(p′,q′)为卷积图像每个像素点的坐标,Mr′、Mc′分别为待评价样本字体图像Wt,t=1,2,…,m窗口的的高和宽,Nr′、Nc′分别为Gabor滤波器图像Gk的高和宽;最终得到所有训练样本字体经二十个Gabor滤波器组卷积后的图像x=1,2,…,g和所有待评价样本字体经二十个Gabor滤波器组卷积后的图像t=1,2,…,m。5