一种QUIC协议下基于深度强化学习的视频流自适应传输方法-豆柴文库

一种QUIC协议下基于深度强化学习的视频流自适应传输方法.pdf

2023-07-21

10金币

997KB

18页

慧颖****23

实名认证

内容提供者

1/10

2/10

3/10

4/10

5/10

6/10

7/10

8/10

9/10

10/10

亲，该文档总共18页，到这已经超出免费预览范围，如果喜欢就直接下载吧～

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN115022684A(43)申请公布日2022.09.06(21)申请号202210586839.2H04L65/80(2022.01)(22)申请日2022.05.27H04L67/06(2022.01)G06N3/04(2006.01)(71)申请人西安交通大学G06N3/08(2006.01)地址710049陕西省西安市碑林区咸宁西路28号(72)发明人王志文张源鸿张未展郑庆华杜海鹏吕格丽张志浩曹坚翔袁慕遥焦慕妍(74)专利代理机构西安智大知识产权代理事务所61215专利代理师段俊涛(51)Int.Cl.H04N21/24(2011.01)H04N21/2662(2011.01)H04L65/1069(2022.01)权利要求书4页说明书10页附图3页(54)发明名称一种QUIC协议下基于深度强化学习的视频流自适应传输方法(57)摘要一种QUIC协议下基于深度强化学习的视频流自适应传输方法，结合基于门控循环单元(GRU)和卷积(CNN)的神经网络建立网络轨迹特征的提取模型，利用注意力机制学习不同特征对带宽的影响，预测未来时刻带宽信息；将预测的带宽信息作为码率决策的状态输入，建立QoE奖励模型，采用PPO算法训练强化学习网络，决策最优码率；客户端根据码率自适应决策模块的反馈结果将相应视频下载并播放，实现QUIC下的视频流自适应传输框架。本发明能够保证在QUIC协议下，带宽预测模块能够充分提取网络状态信息，实现长窗口的带宽预测，为码率自适应决策提供有效输入，达到充分利用带宽资源的目的，有效提升用户观看体验质量。CN115022684ACN115022684A权利要求书1/4页1.一种QUIC协议下基于深度强化学习的视频流自适应传输方法，其特征在于，包括如下步骤：步骤1，服务器端和客户端建立QUIC连接；步骤2，在服务器端预测网络带宽；步骤3，将带宽预测结果作为码率自适应决策的状态输入，客户端基于服务器端的码率自适应决策结果，选择码率对应的视频文件下载到缓冲区并解码；并在QUIC协议下，联合优化视频传输与播放，减少播放缓冲时间，提高QoE。2.根据权利要求1所述QUIC协议下基于深度强化学习的视频流自适应传输方法，其特征在于，所述步骤1中，Nginx接收到浏览器发送的http请求，将包进行解析；对于静态文件请求，直接访问客户端Nginx配置的静态文件目录，返回客户端请求静态文件；对于动态接口请求，Nginx将请求转发给uWSGI，最后到达Django进行后续处理。3.根据权利要求1所述QUIC协议下基于深度强化学习的视频流自适应传输方法，其特征在于，所述步骤2，在服务器端构建长窗口带宽预测模型，利用带宽历史数据预测网络带宽，所述长窗口带宽预测模型包括两个GRU以及一个CNN，并添加注意力机制；其预测方法为：步骤2.1，将带宽数据抽象为时间序列，利用第一个GRU和CNN提取带宽数据特征，得到包含带宽数据时域特征和空域特征的时空特征矩阵利用连续的第一个和第二个GRU提取带宽数据特征，得到包含带宽数据时域特征的时域特征矩阵H′t；步骤2.2，将时空特征矩阵作为注意力机制的输入向量，将时域特征矩阵H′t作为注意力机制的查询向量，学习时空特征对于预测值的权重贡献，从而得到t+1时刻的带宽预测结果yt+1。4.根据权利要求3所述QUIC协议下基于深度强化学习的视频流自适应传输方法，其特征在于，所述长窗口带宽预测模型利用历史时间窗口中不同时间步的带宽历史数据预测网络带宽。5.根据权利要求3所述QUIC协议下基于深度强化学习的视频流自适应传输方法，其特征在于，所述步骤2.1，包括：将当前时刻t的历史带宽序列Xt输入到第一个GRU中，得到用于带宽预测的中间向量Ht，表征为Ht＝GRU(Xt,θt)，其中，θt表示GRU内部Gate的参数，包含了权重矩阵及偏置；将Ht作为CNN的输入，进行卷积处理，提取出历史带宽数据的周期性特征，计算式为其中，W表示过滤器的权重参数，b表示过滤器的偏置项，*表示卷积操作，σ表示激活函数；CNN的输出即将表示为行向量形式如下：表示的第i维，对Ht进行卷积操作后，得到的矩阵中包含带宽数据的时域特征和空域特征，称为时空特征矩阵；同时，将Ht作为第二个GRU的输入，得到H′t，将表示为行向量形式如下：H′t＝[H′t1,H′t2,…,H′ti,…]H′ti表示H′t的第i维；2CN115022684A权利要求书2/4页所述步骤2.2包括输入向量和查询向量H′t的打分计算、权重值计算以及根据权重计算输出向量三个部分，其中：采用注意力打分机制中的加性模型计算得到分数集合S＝[s1,s2,…,si,…,st]的各元素，元素其中t是S中的元素个数，Vs、Wls、Wc

相关资料

一种QUIC协议下基于深度强化学习的视频流自适应传输方法.pdf

一种QUIC协议下基于深度强化学习的视频流自适应传输方法，结合基于门控循环单元(GRU)和卷积(CNN)的神经网络建立网络轨迹特征的提取模型，利用注意力机制学习不同特征对带宽的影响，预测未来时刻带宽信息；将预测的带宽信息作为码率决策的状态输入，建立QoE奖励模型，采用PPO算法训练强化学习网络，决策最优码率；客户端根据码率自适应决策模块的反馈结果将相应视频下载并播放，实现QUIC下的视频流自适应传输框架。本发明能够保证在QUIC协议下，带宽预测模块能够充分提取网络状态信息，实现长窗口的带宽预测，为码率自适

2023-07-21

997KB

一种基于模型预测控制的点云视频流自适应传输方法.pdf

本发明公开了一种基于模型预测控制的点云视频流自适应传输方法，包括：1.将每帧的点云视频在空间上进行均匀切分，并将每个切块压缩编码成不同质量等级的版本；2.将点云视频序列帧在时间上分组，以帧组为最小单位；3.将不同质量等级的切块储存在服务器中，并生成其描述文件；4.服务器端根据MPC算法，并以构造的QOE作为目标函数，选取下一帧组要下载的合适的质量等级，以保证QOE目标函数尽可能大；5.客户端合适的切块后将其解码，融合，渲染然后即时播放。本发明能够在网络环境波动的情况下有一定的预见性，稳定控制buffer，

2024-01-06

1.1MB

一种基于深度强化学习的多摄像头实时视频传输方法.pdf

本发明公开了一种基于深度强化学习的多摄像头实时视频传输方法,包括以下步骤：S1.对原始视频流进行采集；S2.发送端对视频流进行编码，同时保留编码过程中的视频运动向量；S3.发送端判断是否存在新视频配置；S4.发送端对原始视频进行修改处理;S5.将得到的新视频流与保留的运动向量向接收端进行传输，并保留发送时间戳；S6.接收视频流与运动向量，统计单位时间内接收到的视频体积传递至强化学习模型中;S7.判断强化学习模型是否处于训练阶段，并计算新的视频配置；S8.接收端将新视频配置发送至发送端。本发明能够实时给出最

2023-11-05

389KB

一种基于深度强化学习的自适应众包方法.pdf

本发明公开了一种基于深度强化学习的自适应众包方法。方法具体为：1)首先从众包系统中采样需要分配的任务和候选的众包工人；2)通过深度学习方法获得待分配任务和候选工人的低维特征表示；3)通过强化学习方法确定任务分配策略；4)众包系统根据分配策略分配任务，根据任务完成结果评估本次分配获得的收益，将该收益反馈给强化学习方法，更新强化学习参数；5)从1)开始继续下一轮的任务分配。和现有技术相比，本发明结合了深度强化学习方法，系统地对任务分配问题进行建模，针对不同任务本身的特征选择合适的众包工人，形成了自适应的智能众

2023-08-31

523KB

一种基于深度强化学习的自适应导频方法.pdf

本发明公开了一种基于深度强化学习的自适应导频方法，方法包括：发送端获取接收端返回的信道统计信息；基于信道统计信息，利用预训练好的基于深度强化学习的导频决策模型进行决策，得到导频决策结果；根据所述导频决策结果，调整时‑频域的导频间距和导频功率；其中所述基于深度强化学习的导频决策模型包括两个结构相同的评估神经网络和目标神经网络；采用ε‑greedy贪婪算法来进行训练至达到预设条件，得到训练好的基于深度强化学习的导频决策模型。该模型能够根据信道时变的统计特性调整导频分布和功率来适应非平稳的信道特性，在保证信道估

2023-06-04

2MB