预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共48页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113709454A(43)申请公布日2021.11.26(21)申请号202010446721.0(22)申请日2020.05.22(71)申请人华为技术有限公司地址518129广东省深圳市龙岗区坂田华为总部办公楼(72)发明人岳泊暄王成龚骏辉沈建强(74)专利代理机构广州三环专利商标代理有限公司44202代理人熊永强李稷芳(51)Int.Cl.H04N19/103(2014.01)H04N19/156(2014.01)G06N3/08(2006.01)权利要求书4页说明书35页附图8页(54)发明名称视频编码方法、模型训练方法及相关装置(57)摘要本申请实施例提供一种视频编码方法、模型训练方法及相关装置,该方法包括:获取目标视频的目标编码单元;根据目标编码单元的信息和第一模型确定目标编码策略,第一模型是基于多个样本编码单元的数据元组训练得到的模型,多个样本编码单元中的目标样本编码单元的数据元组包括第一状态、第一编码策略、第一反馈、第二状态,第一状态包括目标样本编码单元的信息,第一编码策略是把第一状态转换成第二状态所使用的编码参数;第二状态包括目标样本编码单元之后的一个样本编码单元的信息,第一反馈为基于奖励函数得到的表征目标样本编码单元的编码效果的参数;根据目标编码策略对目标编码单元进行编码。采用本申请实施例,能够提高视频编码的效率。CN113709454ACN113709454A权利要求书1/4页1.一种视频编码方法,其特征在于,包括:获取目标视频的目标编码单元,所述目标视频由所述目标编码单元在内的多个编码单元组成;根据所述目标编码单元的信息和第一模型确定目标编码策略,所述第一模型是基于多个样本编码单元的数据元组训练得到的模型,所述多个样本编码单元中的目标样本编码单元的数据元组包括第一状态、第一编码策略、第一反馈、第二状态,其中,所述第一状态包括所述目标样本编码单元的信息,所述第一编码策略是把所述第一状态转换成所述第二状态所使用的编码参数;所述第二状态包括所述目标样本编码单元之后的一个样本编码单元的信息,所述第一反馈为基于奖励函数得到的表征所述目标样本编码单元的编码效果的参数,所述目标样本编码单元为所述多个样本编码单元中的任意一个样本编码单元;根据所述目标编码策略对所述目标编码单元进行编码。2.根据权利要求1所述的方法,其特征在于,所述根据目标编码单元的信息和第一模型确定目标编码策略之前,还包括:获取所述第一模型,所述第一模型为基于深度强化学习得到的神经网络。3.根据权利要求1或2所述的方法,其特征在于,所述编码单元为待编码的视频帧中的像素块,所述编码单元的信息包括像素块的参考像素组,所述第一状态为样本视频帧中的样本像素块的参考像素组,所述第一编码策略为所述样本像素块的像素预测类型;所述第二状态为所述样本像素块之后的一个像素块的参考像素组;所述第一反馈为基于奖励函数得到的表征所述样本像素块的编码效果的参数。4.根据权利要求1或2所述的方法,其特征在于,所述编码单元为待编码的视频帧或者待编码的视频帧中的局部像素块,所述编码单元的信息包括所述待编码的视频帧的帧类型,所述第一状态为样本编码帧的帧类型;所述第一编码策略为所述样本编码帧的块分割类型;所述第二状态为所述样本视频帧之后的一个视频帧的帧类型;所述第一反馈为基于奖励函数得到的表征所述样本视频帧的编码效果的参数。5.根据权利要求1或2所述的方法,其特征在于,所述编码单元为待编码的视频帧,所述编码单元的信息包括所述待编码的视频帧的前向和/或后向的帧类型序列;所述第一状态为样本视频帧的前向和/或后向的帧类型序列;所述第一编码策略为所述样本视频帧的帧类型,所述帧类型包括关键帧、向前预测帧和向前向后预测帧,所述视频帧的信息包括所述视频帧的前向和/或后向的帧类型序列;所述第二状态为样本视频帧之后的一个视频帧的前向和/或后向的帧类型序列;所述第一反馈为基于奖励函数得到的表征所述样本视频帧的编码效果的参数。6.根据权利要求1或2所述的方法,其特征在于,所述编码单元为待编码的视频帧中的像素块,所述像素块的信息包括所述像素块的像素以及所述像素块是否属于所述像素块所在的视频帧的感兴趣区域ROI;所述第一状态为样本视频帧中的样本像素块的像素以及所述样本像素块是否属于所述样本像素块所在的视频帧的ROI;所述第一编码策略为量化参数QP,所述QP用于控制码率或者编码质量;所述第二状态为所述样本像素块之后的一个像素块的像素以及是否属于所在的视频帧的ROI;所述第一反馈为基于奖励函数得到的表征所述样本像素块的编码效果的参数。7.根据权利要求3-6中任一项所述的方法,其特征在于,所述第一反馈为通过奖励函数2CN113709454A权