预览加载中,请您耐心等待几秒...
1/9
2/9
3/9
4/9
5/9
6/9
7/9
8/9
9/9

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN115086663A(43)申请公布日2022.09.20(21)申请号202210883472.0G06N3/04(2006.01)(22)申请日2022.07.26G06N3/08(2006.01)(71)申请人香港中文大学(深圳)地址518100广东省深圳市龙岗区龙城街道龙翔大道2001号(72)发明人王方鑫张若瑜(74)专利代理机构成都巾帼知识产权代理有限公司51260专利代理师邢伟(51)Int.Cl.H04N19/124(2014.01)H04N7/18(2006.01)H04N19/146(2014.01)H04N19/513(2014.01)H04N19/57(2014.01)权利要求书2页说明书5页附图1页(54)发明名称一种基于深度强化学习的多摄像头实时视频传输方法(57)摘要本发明公开了一种基于深度强化学习的多摄像头实时视频传输方法,包括以下步骤:S1.对原始视频流进行采集;S2.发送端对视频流进行编码,同时保留编码过程中的视频运动向量;S3.发送端判断是否存在新视频配置;S4.发送端对原始视频进行修改处理;S5.将得到的新视频流与保留的运动向量向接收端进行传输,并保留发送时间戳;S6.接收视频流与运动向量,统计单位时间内接收到的视频体积传递至强化学习模型中;S7.判断强化学习模型是否处于训练阶段,并计算新的视频配置;S8.接收端将新视频配置发送至发送端。本发明能够实时给出最佳视频配置,能部署在大规模多摄像头集群中,具有更低的时延与更低的带宽资源消耗。CN115086663ACN115086663A权利要求书1/2页1.一种基于深度强化学习的多摄像头实时视频传输方法,其特征在于:包括以下步骤:S1.实时视频传输开始后,发送端根据默认视频配置对摄像头输出的原始视频流进行采集,所述默认视频配置包括分辨率、帧率、量化参数三个参数;S2.发送端采用H.264视频编码器对视频流进行编码,编码参数中的分辨率、帧率与量化参数与默认视频配置保持一致,并额外保留编码过程中编码器所计算出的视频运动向量;S3.发送端判断当前是否存在新视频配置:若不存在,即当前处于初始阶段没有新视频配置,或当前新视频配置中的参数与默认视频配置中的参数完全一致,则不进行视频处理,直接将步骤S2编码得到的视频流作为新视频流,并转至步骤S5;若存在,读取当前的新视频配置,并进入步骤S4对原始视频进行处理;S4.发送端通过FFmpeg视频处理工具,并根据步骤S3读取到的新视频配置中的分辨率、帧率与量化参数,对原始视频进行修改处理,得到新的视频流;S5.将步骤S3或S4得到的新视频流与步骤S2保留的运动向量向接收端进行传输,同时保留发送时间戳用以统计视频传输耗时;S6.接收端接收新视频流与运动向量,同时统计单位时间内接收到的视频体积,根据S5中保留的时间戳与接收完视频的接收时间戳统计视频的传输耗时,并构建强化学习神经网络模型;S7.判断强化学习神经网络模型是否处于训练阶段:如果模型不在训练阶段,强化学习神经网络模型将统计的视频体积、传输耗时和视频运动向量,与当前的新视频配置,作为模型输入;通过神经网络神经元计算并分别给出下一时刻的新视频配置;所述当前的新视频配置包括当前的分辨率、帧率与量化参数;所述下一时刻的新视频配置包括下一时刻的分辨率、帧率与量化参数;如果模型在训练阶段,利用当前新视频流和经过默认视频配置的视频流对强化学习神经网络模型进行训练,计算出下一时刻的新视频配置,即强化学习神经网络的输出结果;S8.接收端将下一时刻的新视频配置传输给发送端,更新发送端中的新视频配置,然后返回步骤S1,按照步骤S1~S8进行循环处理摄像头采集到的视频流。2.根据权利要求1所述的一种基于深度强化学习的多摄像头实时视频传输方法,其特征在于:所述步骤S4包括:S401.修改视频帧率,计算新视频配置的帧率与视频原始的帧率比例值,根据比例值对原始视频流进行等步长的均匀抽帧,将抽出的帧进行保留;S402.对S401中保留的帧使用双线性插值算法,将原始帧的分辨率通过算法缩小至新视频配置中的分辨率并进行保留;S403.将S402步所保留的、分辨率经过缩小的帧,通过H.264视频编码器进行编码,将编码器中量化参数设为新视频配置中的量化参数,编码生成新视频流。3.根据权利要求1所述的一种基于深度强化学习的多摄像头实时视频传输方法,其特征在于:所述步骤S5中,在向接收端传输数据时,如果模型在训练阶段,则还需额外传输默认视频配置处理和编码得到的视频流,即步骤S2中得到的视频流,记为默认配置视频流。4.根据权利要求1所述的一种基于深度强化学习的多摄像头实时视频传输方法,其特2CN115086663A权利要求书2/2页征在于: