预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共27页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

HEVC视频编码技术的研究与实现视频编码标准的发展HEVC(HighEfficiencyVideoCoding)是两大组织成立的联合小组JCTVC正在研究的下一代新的视频压缩编码方案,主要针对高清和超高清的视频图像,HEVC目标在H.264/AVChighprofile的基础上,对高分辨率/高保真的视频图像压缩效率提高一倍,也就是在保证相同视频图像质量的前提下,视频流的码率减少50%。HEVC主要是在原H.264/AVC的编码框架上,提出更先进的改进技术,包括扩展的编码单元尺寸、基于块的更灵活的帧间/帧内预测方式、大尺寸块的变换、新的熵编码方法、更加复杂的内插滤波器等。HEVC主要特征HEVC编码器HEVC帧内预测的优化在对预测单元的尺寸的选择上,需要从4×4到64×64各种大小的尺寸都搜索一遍。而对于平坦的区域预测单元一般会选大的分割尺寸,而对于多细节的区域多选择小尺寸的分割,对于这样特殊的情况把所有的尺寸都搜索一遍会浪费很多时间,因此在进行帧内预测之前,先对预测单元的复杂度进行估计,选定某几种预测单元的尺寸,这对现有的选择方法会有很大改进。最小平均绝对误差(MAD)可以被用来估计块的纹理复杂度,MAD的计算可以由下面的公式得来:其中P(x,y)代表当前预测单元中像素点所在位置,m代表该预测单元所有像素的均值,ABS表示取绝对值,2N×2N表示当前最大编码单元LCU的尺寸,这里最大编码单元设置为64×64。用MAD来表示一个预测单元的复杂度,如果平坦则该值相对小,如果纹理细节较丰富那么该值相对大,现在需要找到一个恰当的阈值作为分割点,降低搜索树的深度,减小搜索的范围从而降低复杂度。9为了找到一个合适的阈值,对6个序列进行测试,测试序列分别为BQTerrace(1920×1080)、ParkScene(1920×1080)、vidyo3(720p)、BasketballDrill(832×480)、BQMall(832×480)、ParkScene(832×480),对前两个序列取前80帧全I帧,后面三个序列取前100帧全I帧。序列的纹理复杂度和大小分辨率各有差别,对每个序列在不同QP条件下进行测试。表3-1是测试的结果,MAD是按公式(3-8)以LCU为64×64计算的。表中的数据以64×64预测单元为例,第三列的的数据表示当预测单元的分割模式为64×64时,该预测单元所属的LCU的MAD值大于50的概率。统计结果表明,当分割模式为64×64时,其所属的LCU的MAD值绝大部分小于300,对于32×32的分割模式与64×64一样,其所属LCU的MAD值也都大多小于300。而其他的预测分割模式16×16、8×8和4×4,由表中的统计数据看出他们所属的LCU的MAD值大部分大于50。在某些特殊情况下会出现误判的现象,如序列BQMall,对32×32的分割模式,其所属的LCU的MAD小于50的概率大于百分之十,原因在于图像中一些预测单元内部出现明显的边缘,边缘上的像素值与两边的像素值发生突变,使得整个预测单元的MAD值很大,但是对于边缘两边都是平坦的区域,根据RD判决仍然选用大尺寸的预测单元。但是对于绝大多数的测试序列,判断的准确率都高达百分九十几甚至百分之百。基于大部分测试序列都有很高的命中率,我们可以对编码单元选择帧内预测模式的判决条件制定如下:可以看出MAD小于50和大于300两种条件下的编码单元数占编码单元总数的百分比最高可达43%,最小的有13.1%,由此可以评估出该改进算法将会一定程度上减少运算的复杂度。因此,我们对HEVC帧内预测模式的选择过程要做适当的调整,在整个搜索执行之前加入对LCU的MAD值的计算和判断,先选出预测单元的尺寸模式,缩小搜索范围。性能的评价方法:1516从表中的数据可以看出,采用改进的预判算法和TMUC原有算法比较,总体的编码时间减少平均可达14.47%。在性能方面,从表3-3可以看出,与TMUC中的帧内预测算法相比改进算法PSNR损失平均为0.0014dB,输出码率损失平均为0.12%。其中序列vidyo3_720p的PSNR损失平均为0.0427dB,输出码率损失平均为0.38%,较其他序列性能略差,原因在于序列图像中平坦区域比较多,由前面的分析可知对MAD值小于50的平坦区域只对32×32和64×64尺寸的编码单元搜索,范围相对原算法减少一半多,因此失真度比MAD大于300的编码单元要大。总体来说改进的算法与原TMUC上的算法相比率失真性能无明显下降。1819大尺寸DCT变换二维DCT变换:测试模型中对每一种尺寸的变换块都统一采用Chen快速DCT算法,这个不是最快的算法,但是该算法具有很强的通用性。loeffler等人提出的快速算法只需要11次乘法运算,这个值已经达到理论的极限最小值,同