预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共42页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

项目名称:基于视觉特性的视频编码理论与方法研究首席科学家:高文北京大学起止年限:2009.1至2013.8依托部门:教育部一、研究内容由于可以有效节省通信带宽和存储容量高效率的视频编码技术已经成为数字视频广播(广播网)、数字媒体存储与网络传输(计算机网络)、以及多媒体通讯(通信网)等数字媒体产业的共性关键技术。特别是近年来我国的数字媒体产业迅猛发展年均产值已近万亿元使得音视频编解码标准技术的地位越来越重要。经过多年努力2006年中国终于有了自己的视频编码国家标准AVS。但我们仍需未雨绸缪从模型、理论、方法和技术上为下一代视频编码国家标准和国际标准的制定早做准备确保在下一轮的标准竞争中立于不败之地。从视频编码的需求角度看编码的主要动机是在尽量保证高质量视觉效果的前提下最大限度地降低码率达到压缩的目的。众所周知人类视觉系统的信息处理能力远远超过目前的视频处理系统因此从方法论上借鉴人类视觉系统的视觉信息处理基本神经机制和心理机理构建统一的图像/视频基本结构与表示模型及其相应的视觉计算方法发展将香农信息论与人类视觉系统信息处理原理相结合的高效视觉信息编码理论与方法就成为了本项目的基本出发点和立项依据。视频编码处理的核心环节要对视频中包含的视觉信息进行高效的表达和准确的重建其本质是视觉信息的基本结构和有效表示问题。为此我们需要探讨以下关键科学问题:视频编码可以借鉴的视觉信息处理机理是什么?作为长期进化的结果人类视觉信息处理系统是至为精致的生物系统之一。但遗憾的是其基本神经机制、知觉和认知机理目前尚不完全清晰。本项目将从多学科交叉的角度出发探索视觉信息处理的基本神经机制和认知机理研究相应的理论和模型对其进行实验验证与计算仿真以期能够用以指导建立更加有效的视觉计算模型。视频编码可以利用的符合视觉信息处理机理的计算模型是什么?尽管人类视觉系统的信息处理机理尚不完全明了但随着技术手段的提高脑科学、神经科学和认知心理学专家已经掌握了越来越多的规律并提出了很多假说和模型。如何基于这些发现构建相应的、可计算的视觉信息处理数学模型就成为一个重要的基础科学问题。其解决不仅可以有效促进视觉编码技术的发展还可以从计算模拟的角度反过来推动视觉基本机理的研究。与人类视觉系统特性相吻合的视频表示及编码的理论是什么?香农信息论虽然从理论上给出了编码效率的上界和失真的关系但并未考虑编码的符号(事件)集因而对视频中高阶相关缺乏有效的描述手段。视觉信息论试图借鉴神经生理学在不同感知阶段对感知对象的抽象建立对应的符号(事件)集使之能够方便地描述高阶相关性体现语义结构从而丰富信息论理论。符号(事件)是借鉴稀疏编码理论通过采用贝叶斯计算视觉感知的后验概率建立的。这将为高效视频编码提供指导性的理论基础。上述三个关键科学问题紧紧围绕视觉信息处理系统中最核心的表示与编码问题分别从生理/心理基本机理、视觉信息处理计算模型、视频编码基础理论三个层面展开。其中视觉基本机理既是基本出发点也是落脚点计算模型是桥梁和纽带视觉信息论则是设计和实现下一代视频编码方法和技术的理论基础。围绕上述三个关键科学问题我们提出的总体研究内容框架如图2所示以期建立解决这些问题的模型、理论和方法构建相应的验证平台和原型系统。如图所示对应三个关键科学问题本项目的主要研究内容自底向上分别建立在三个层面即:机理与模型层理论与方法层关键技术与验证层。下面我们分别从这三个层面对本项目的主要研究内容进行阐述。2.1视觉基本机理与模型层该层面的研究内容面向的科学问题主要是前两个:视觉信息处理的基本机理和符合这些基本机理的计算模型。不难理解二者有天然的紧密联系:一方面视觉信息处理基本机理为视觉信息处理的计算仿真、计算模型建立等提供了良好的生理学和心理学参照系对其基本规律的认识为计算模型的建立提供了良好的技术可能性和努力方向。另一方面计算模型也为基本机理的正确性和模型的有效性提供了验证机会有利于推动视觉基本机理的研究。下面分别叙述本项目在视觉基本机理和计算模型方面拟开展的研究。2.1.1视觉信息处理基本机理研究在视知觉机理方面将主要从生理、心理角度通过神经电生理学、视觉行为学、药物学等研究手段在灵长类动物上采用包括微电极矩阵记录方法、高时间分辨率的事件相关电位(ERP)、功能核磁共振(fMRI)等技术手段从初级视觉皮层V1神经元群体反应特性入手研究V1神经元经典和非经典感受野与上级视觉皮层区域神经元正向和反向联系、V1神经元之间的横向联系以及视觉学习过程中神经元群视觉编码模式的变化特性探索初级和高级皮层中的神经元群在视觉处理中对简单和复杂视觉刺激的编码模式以及动态反应模式各级皮层神经元群对不同视觉模式识别的贡献考察视觉注意和知觉组织之间相互影响和交互作用以验证或改进现有假说或理论模型(如稀疏编码、群组编码、视觉注意、增量成组假说等