预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共23页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

基于形状上下文的形状匹配和目标识别摘要:我们提出了一种测量图形间相似性的新方法,并开发它来做目标识别。在我们的架构下,相似性的度量之前:1)解决两种形式下点与点的对应性2)利用这种对应性来估计一个对齐变换。为了解决对应问题,我们为每一个点附上一个形状上下文的描述。一个参考点的形状上下文能捕捉剩下与之相关的点的分布情况,从而提供全面的可识别的描述。两个相似图形上的对应点会有相似的形状语境,使我们将解决对应问题看做最优分配问题。给出点与点的对应,我们估计最佳匹配两种形状的变换,为这个用途,正则化薄板样条函数提供了灵活的图类转换。两个形状间的不同通过对应点间的匹配误差总和与测量对齐变换的大小项一起来计算。我们把最近邻分类架构下的识别当作在图像上查找最大限度相似的存储原型问题,结果是轮廓线、商标、手写数字和线圈数据集。关键词:形状,目标识别,数字识别,对应性问题,MPEG7标准,图像配准,变形模板1绪论考虑图1中的两个手写体数字。视为像素亮度值的向量使用二级规范相比,他们有很大的不同。但是,视为形状,它们显得和人类的观察员类似。我们在本文的目的是实施形状相似这一概念,其最终目的是用它作为概念层次识别的基础。我们通过一个三阶段的过程来实现:解决这两个图形间的对应问题使用对应关系来估算对齐变换用对应点之间的匹配误差的总和,加上测量对齐变换的大小,来计算两个形状之间的距离我们的做法的关键是传统的形状匹配变形,可至少追溯到达西汤普森。在他的经典作品中,对增长和形式[55],汤普森指出,相关但不相同的形状,往往可以使用简单的坐标变换对齐,如图2所示的变形。在计算机视觉文献,费什勒和Elschlager[15]实施了在质量弹簧模型中使用mini-mization能源这一想法。Grenander等[21]在概率设置中发展了这个想法,Yuille[61]通过使用梯度下降的图像域下的手工制作的拟合参数化模型,如眼睛,来发展变形模板概念的另一变体。另一个众所周知的这一脉的计算方法是由Lades[31]等人通过lastic图匹配发展而来。我们在这项工作的主要贡献是发现形状之间对应关系的强大和简单的算法。形状代表了一系列形状轮廓(通常为100左右从边缘探测器输出采样的像素位置)采样点。这里没有什么特别的点,它们不需标记或曲率极值等,使用的样本越多,我们获得越好的近似的基本形状。我们引进一个形状描述符,形状上下文,来描述对于给定一个的点的形状的其他部分的粗分布。两个形状之间的对应关系则相当于为一个形状上每个采样点找到其他形状上的最相似形状上下文。最大化的相似性和执行的独立性,导致一个二分图的匹配(等效,最优分配)问题。根据需要,我们可以很容易结合其他匹配的信息来源,例如在对应点的本地外观的相似性。给出采样点的对应关系,我们通过估计反应一个形状到另一个形状的映射的关系的对齐变换来延长通信完整的形状。图2提供了这个想法的一个经典说明。转换可以从许多的家系中挑选,在各种应用中,我们已经使用了欧氏,仿射和正则化薄板样条函数。对齐形状,简单定义,就是形状相似性的衡量。两个形状之间的相异现在用对应点之间的匹配误差的总和,加上一个变形转换的幅度来测量。图1.两个手写体数字的例子。就像素到像素比较而言,这两个图像是相当不同的,但是人类的观察者看到的形状是相似的。针对这一差异性措施,我们可以使用最近邻技术来进行目标识别。哲学上,最邻近技术与Rosch[47][48]等人开发的基于原型的识别有关。它们具备的优势,向量空间结构不是只需要一个成对相异的措施。我们证明了各种各样设置下的目标识别。我们处理2D对象,例如,手写数字的MNIST数据集(图8),轮廓线(图11和13),以及使用多个视图建模的哥伦比亚线圈数据集中的3D对象(图10)。这些广泛使用的基准和我们的方法原来在其中有数据比较的问题中是领先的。我们还开发了一种基于视觉复杂性的为每个对象类选择其存储视图的技术。作为说明,我们在COIL-20数据集中的3D对象中表现了,能够获得低至2.5%的错误分类误差,只使用每个目标对象的4个视图的平均(见图9和10)。本文的结构如下:我们在第二部分讨论相关的工作,在第三部分详细描述形状匹配的方法,在第四部分展示变换模型。然后,我们在第五部分讨论形状相似性的度量,并在第六部分引用包括手写体数字和3D物体图片在内的一系列数据集证明我们提出的方法。我们在第七部分进行总结。2形状匹配的已有工作数学家通常定义形状为一群变换下的一个等价类。这个定义在视觉分析上下文中是不完全的。这只能告诉我们两个形状何时是完全相同的。至于形状相似或形状距离理论,我们需要的更多。统计学上定义的形状,Bookstein[6]或Kendall[29],假定对应关系是已知的,致力于形状距离的问题。其它关于形状对应的统计学方法不