预览加载中,请您耐心等待几秒...
1/5
2/5
3/5
4/5
5/5

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

基于FSVM脱机手写体汉字分类识别研究 摘要 随着现代社会信息化程度不断提高,手写体识别技术也逐渐成熟。脱机手写汉字识别是其中的一个领域,从脱机的手写输入原始数据中自动识别汉字。本文提出了一种基于FSVM的脱机手写体汉字分类识别方法。该方法首先采用HOG特征提取器提取图像的特征,接着使用FSVM分类器对这些特征进行分类和识别。实验结果表明,该方法能够有效地对手写体汉字进行分类识别,识别率达到87%以上。 关键词:脱机手写体汉字识别;FSVM;HOG特征提取器;分类识别。 Abstract Withthecontinuousimprovementoftheinformationizationlevelofmodernsociety,handwritingrecognitiontechnologyhasgraduallymatured.OfflinehandwrittenChinesecharacterrecognitionisoneofthefields,whichautomaticallyrecognizesChinesecharactersfromofflinehandwritteninputrawdata.ThispaperproposesamethodofofflinehandwrittenChinesecharacterclassificationrecognitionbasedonFSVM.ThemethodfirstusestheHOGfeatureextractortoextractthefeaturesoftheimage,andthenusestheFSVMclassifiertoclassifyandrecognizethesefeatures.TheexperimentalresultsshowthatthismethodcaneffectivelyclassifyandrecognizehandwrittenChinesecharacters,witharecognitionrateofmorethan87%. Keywords:offlinehandwrittenChinesecharacterrecognition;FSVM;HOGfeatureextractor;classificationrecognition. 一、绪论 脱机手写汉字识别是手写汉字识别的一个重要分支。它指的是从图像形式的手写输入原始数据中自动识别并翻译文字。脱机手写汉字识别广泛应用于文字识别、汉字检索、文本分类等领域。传统的汉字识别方法主要包括特征提取和分类器两步。常见的特征提取方法有Yin和Liu提出的HOG特征、Zhang和Zhou提出的Gabor滤波器等。分类器包括SVM、BP神经网络、K-近邻等。 此外,由于FSVM分类器在解决模糊分类问题上的表现优于传统的SVM分类器,因此在识别汉字这类模糊分类集合中,FSVM分类器的应用备受关注。本文将HOG特征提取和FSVM分类器相结合,提出一种基于FSVM脱机手写体汉字分类识别方法。 二、HOG特征提取 HOG(HistogramsofOrientedGradients)特征提取是一种针对目标检测和跟踪的特征提取。该方法可以从图像中提取局部区域的梯度直方图,用于描述图像的特征。HOG特征描述了图像的纹理、形状和边缘等特征信息。 在对脱机手写体汉字进行分类识别中,采用HOG特征提取方法可以有效地提取出图像中的特征。具体步骤如下: 1.图像预处理。对原始图像进行灰度化处理,即将RGB图像转换为灰度图像,去除图像中的颜色信息,便于后续处理。 2.对原图像进行正规化处理。我们将图像大小统一到64*64大小,便于后续进行分类识别。 3.计算梯度幅度。使用Sobel算子等常见的算子计算图像中每个像素的梯度幅度,得到图像的梯度图像。梯度的大小和方向可以用于描述图像的边缘和纹理特征。 4.计算梯度直方图。将图像分为一系列大小相等的区域(例如,每个区域为4×4像素),统计每个区域中所有像素的梯度幅度方向和大小信息,并把它们组合在一起形成一个直方图。 5.对所有区域的直方图进行归一化,以减少光照、阴影等因素对图像特征的影响。 6.最后,将归一化后的直方图特征向量作为HOG特征向量表示图像的特征。 三、基于FSVM的脱机手写体汉字分类识别方法 1.数据预处理 手写输入的脱机汉字原始数据表现形式为序列化的点列信息,我们需要将这些点列转换为图像的形式。具体步骤如下: 1.将点列转换为笔画序列,并将每个笔画所对应的点列提取出来。 2.根据笔画序列和每个笔画对应的点列,还原出每个汉字的图像形式。 3.将图像进行缩放、灰度化处理,统一为64*64的大小,以便于后续处理。 4.剔除噪声点,提高图像质量。 2.特