预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共13页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局*CN103279770A*(12)发明专利申请(10)申请公布号(10)申请公布号CNCN103279770103279770A(43)申请公布日2013.09.04(21)申请号201310225735.X(22)申请日2013.06.06(71)申请人哈尔滨工业大学地址150001黑龙江省哈尔滨市南岗区西大直街92号哈尔滨工业大学计算机科学与技术学院(72)发明人邬向前卜薇唐有宝(51)Int.Cl.G06K9/68(2006.01)G06K9/46(2006.01)权权利要求书3页利要求书3页说明书7页说明书7页附图2页附图2页(54)发明名称基于笔画片段和轮廓特征的笔迹识别方法(57)摘要本发明涉及一种基于笔画片段和轮廓特征的笔迹识别方法,首先需要将书写人书写的笔迹用扫描仪扫描成静态图像,然后利用图像处理技术将笔迹图像进行二值化和边缘提取得到相应的二值图像和轮廓图像,然后利用本发明提出的特征提取方法分别对二值图像和轮廓图像进行特征提取,最后利用模式识别技术对提取的特征进行身份识别。本发明提取了一种新的基于笔画片段和码书技术的特征提取方法和新的基于笔画轮廓的特征提取方法。并将两个提出的特征进行融合,进一步提高了识别精度。CN103279770ACN103279ACN103279770A权利要求书1/3页1.一种基于笔画片段和轮廓特征的笔迹识别方法,其特征在于,方法如下:(1)笔迹图像的获取要求书写人在颜色单一的纸上书写任意一段文字,然后利用扫描仪将纸上的文字扫描到电脑中,得到静态的笔迹图像;(2)笔迹图像二值化和边缘提取扫描得到的笔迹图像为灰度图像,利用大津法对原始的灰度图像进行自适应二值化处理,得到二值图像,然后根据连通体的面积将二值图像中小的连通体去除,最后利用传统的边缘检测方法提取笔迹轮廓图像;(3)笔画分割及码书构造首先对笔画进行定义,将笔迹二值图像中的每一个连通体作为一个笔画,采用不同的笔画片段在笔迹图像中出现的频率作为特征来区分每个书写人的身份,首先要进行笔迹分割过程来提取笔画片段,采用基于滑动窗口的笔迹分割方法分为以下几个步骤:3.1)获取笔迹图像中所有的连通体;3.2)对每一连通体,计算保护它的最小矩形,设该矩形的宽为WCC,高为HCC;3.3)根据最小矩形,构造一个滑动窗口,该窗口的宽为WSW=30,高为最小矩形的高HCC;3.4)在最小矩形上,以步长为Gap,从左到右的移动滑动窗口,每次滑动窗口里的都是一个片段,得到多个片段;3.5)对每一片段,将其归一化到大小为30×30,并保持原始片段中连通体的长宽比,把归一化后的片段称之为一个笔画片段,最后用一个由0和1组成的大小为900的向量来表示每一个笔画片段;利用自组织神经网络聚类算法,从训练样本的笔画片段中构造一个笔画片段的码书,码书由少数量的通用的笔画片段组成,其中每一个通用的笔画片段被称之为一个码字;(4)基于笔画片段的特征提取构造完码书之后,从笔迹图像中提取一种笔画片段直方图特征,称为SFH特征,用SF={f1,f2,...,fn}记为n个从笔迹图像中分割得到的笔画片段,并用C={c1,c2,...,cN}记为大小为N的一个笔画片段码书。SFH特征的提取过程如下:4.1)初始化大小为N的SFH特征向量,如SFH=[0,0,...,0]。4.2)对每一个笔画片段fi∈SF,计算它和每一个码字cj∈C之间的欧式距离,如下:计算完之后,对每一个笔画片段fi,我们将得到一个欧式距离向量EDVi,如下:EDVi=[EDi1,EDi2,...,EDiN].4.3)对EDVi进行升序排序,并得到排序后EDVi中的钱t个元素的索引,记为:IDX={idx1,idx2,...,idxt}.4.4)对前t个元素进行指数变换和归一化过程,并得到一个响应向量RVi,计算过程如下:2CN103279770A权利要求书2/3页RVi=[rvi1,rvi2,...,rvit]其中delta是一个常数;4.5)对每一个idxk∈IDX,用如下方式更新SFH特征向量:4.6)重复步骤4.2到步骤4.5,使所有的笔画片段都被处理;4.7)计算最终的SFH特征向量,如下:(5)基于轮廓的特征提取针对笔迹轮廓图像提出了一种局部轮廓模型直方图特征,简称为LCPH特征,LCPH特征提取过程需要跟踪笔迹轮廓图像中的每一个轮廓点;局部轮廓模型定义为每个轮廓点的一个n×n的邻域,n=17时,识别精度最高,因此局部轮廓模型的带下为17×17;为了能具体表述局部轮廓模型,将局部轮廓模型划分为多个大小为3×3的小块,并且在水平和垂直方向相邻的两个小块重叠一个像素。在每个小块中,用1表示轮廓点,0表示背景点,这样每个小块将会由9个由0或1组成的二进制串,因此在每个小块