预览加载中,请您耐心等待几秒...
1/2
2/2

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

立体视频系统中深度传播算法的研究综述报告 立体视频系统是一种透过双目摄像机采集图像信息,再经过图像处理与计算机图形学算法实现的3D视频呈现系统。其关键在于对场景深度信息的获取与传播。因此,研究深度传播算法具有重要意义。本文对立体视频系统深度传播算法的研究现状进行综述。 立体视频系统工作原理为双目视觉原理,即两个摄像机同时拍摄同一物体或场景,因视角的差异给人眼带来立体感。而对立体视频建模的核心在于场景深度(disparity)的计算。常用的测量方法包括时间和空间两种,其中时间测量一般采用对消方法,即通过计算两个图像之间的位移来得到场景深度。而空间测量则是基于三角测量原理,通过三角形求解得到场景深度。而在实际应用中,二者常常结合使用,互相补充。然后,通过深度图的传播实现场景的3D呈现。 深度图传播有多种算法,按照传播模型可分为贝叶斯模型和基于视觉特征的图割模型两类。 贝叶斯模型的核心思想是在场景中计算每个像素点属于前景或背景的概率,并以概率图的形式表示出来。其中可以采用的方法包括机器学习和统计学习方法。机器学习方法还可以根据前景背景的一些特征来分类。比如,基于颜色、纹理、形状和运动等特征,通过构建特征向量和分类器对图像中的像素点分类。统计学习方法则主要依靠场景的先验信息,对图像进行贝叶斯推断,得到每个像素点前景和背景的概率。贝叶斯模型的优点在于准确率高,对于初值选取不敏感,且对于场景的适应性强。常用的算法有Hopfield、Markov随机场和空间间隔自适应计算机先验等。 基于视觉特征的图割模型则是利用最小割/最大流算法最优化能量函数,以达到场景深度图的计算目的。常用算法包括BeliefPropagation算法、GraphCut算法和Stereoscopy3DMatchingTechniques等。其中GraphCut算法是一种基于连通性的方法,其核心在于将图像建成一个图,然后寻找一条最小的割使得图分为两部分,从而得出场景深度图。BeliefPropagation算法则是将场景深度图分解为小区域,每个区域都服从高斯分布,然后通过消息传递算法来计算每个像素点的前景面和背景面的权重,得到场景深度图。Stereoscopy3DMatchingTechniques算法则是利用立体视觉原理,将左右两个视图进行区域划分,然后再通过特征点匹配算法得到场景深度图。 综上所述,立体视频系统深度传播算法涉及多个方面的知识,包括计算机视觉、图像处理、计算机图形学等。目前已有很多文献对此进行了深入研究,本文只是简单概述了部分研究方法。未来,深度学习等新技术的应用还将不断拓展深度传播算法的研究空间和改进方向。