预览加载中,请您耐心等待几秒...
1/2
2/2

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

基于四元数傅里叶梅林变换的旋转不变彩色纹理分类 引言 旋转不变性是计算机视觉领域研究的重要问题之一。在许多视觉任务中,图像或纹理的旋转不应该影响最终的结果。例如,在对象识别中,通过旋转前景图像,应该能够得到相同的识别结果。为了解决这个问题,研究者提出了许多不同的方法。其中一种被广泛使用的方法是使用基于旋转不变性的特征描述符,例如局部二进制模式(LBP)和旋转不变的局部三元模式(RLTP)。然而,这些描述符只能用于旋转不变的单通道图像,而不能应用于旋转不变的多通道图像或彩色纹理图像。为了解决这个问题,一些基于傅里叶变换的方法被提出。在这篇论文中,我们将介绍一种基于四元数傅里叶变换的方法来实现旋转不变的彩色纹理分类。 方法 首先,我们将输入图像分解为三个通道:红色通道、绿色通道和蓝色通道。然后,对于每个通道,我们将其转换为一组四元数图像。四元数可以看作是复数的扩展,具有四个维度:实部、虚部i、虚部j和虚部k。四元数图像可以用于表示旋转不变的彩色纹理图像,因为它们比常规的三通道图像更加富有表现力。接下来,我们将四元数图像的每个像素点表示为q(x,y)=(a(x,y),bi(x,y),cj(x,y),dk(x,y)),其中a(x,y),b(x,y),c(x,y)和d(x,y)是实值函数。在四元数傅里叶变换(QFT)中,给定一个四元数图像f(x,y),其QFT定义为: F(u,v)=[A(u,v),B(u,v)i,C(u,v)j,D(u,v)k] 其中 A(u,v)=∑∑f(x,y)cos(2π(u(x−1)/N+y(y−1)/M)) B(u,v)=∑∑f(x,y)sin(2π(u(x−1)/N+y(y−1)/M)) C(u,v)=∑∑g(x,y)cos(2π(u(x−1)/N+y(y−1)/M)) D(u,v)=∑∑g(x,y)sin(2π(u(x−1)/N+y(y−1)/M)) 其中N和M是输入图像的宽度和高度,(u,v)是频率域中的点。此外,我们还定义了逆四元数傅里叶变换(IQFT): f(x,y)=(1/NM)∑∑F(u,v)[cos(2π(u(x−1)/N+y(y−1)/M))+B(u,v)i+C(u,v)j+D(u,v)k] 在旋转不变的彩色纹理分类中,我们使用了两个基于四元数的算法。第一个算法是基于四元数自相关函数的算法。我们将四元数图像沿着平滑函数进行旋转(例如,高斯函数),并计算它们之间的自相关函数。此过程可以通过IQFT进行实现。第二个算法是基于四元数相位谱的算法。我们计算每个四元数图像的相位谱,并使用这些相位谱来计算它们之间的距离。我们使用了欧几里德距离和相关系数来比较相位谱。最终,我们将这些距离用于分类。 实验结果 我们在两个公共数据集上评估了我们的方法:KTH-TIPS-2a和MDID2013。KTH-TIPS-2a包含11个类别的纹理图像,每个类别有12张图像。图像是从不同方向和光照条件下拍摄的。MDID2013包含10个类别的100幅彩色图像。实验结果表明,我们提出的基于四元数傅里叶变换的旋转不变彩色纹理分类算法比其他方法在旋转不变的彩色纹理分类上表现更好。 结论 在本文中,我们提出了一种基于四元数傅里叶变换的方法来实现旋转不变的彩色纹理分类。我们使用了两个基于四元数的算法来比较四元数图像之间的相似性。实验结果表明,我们的方法在旋转不变的彩色纹理分类上表现更好。未来的工作包括将该方法应用于其他视觉任务中,以及进一步研究更有效的算法来计算四元数傅里叶变换和其相应的逆变换。