一种基于深度强化学习的自适应导频方法.pdf
灵慧****89
亲,该文档总共15页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
一种基于深度强化学习的自适应导频方法.pdf
本发明公开了一种基于深度强化学习的自适应导频方法,方法包括:发送端获取接收端返回的信道统计信息;基于信道统计信息,利用预训练好的基于深度强化学习的导频决策模型进行决策,得到导频决策结果;根据所述导频决策结果,调整时‑频域的导频间距和导频功率;其中所述基于深度强化学习的导频决策模型包括两个结构相同的评估神经网络和目标神经网络;采用ε‑greedy贪婪算法来进行训练至达到预设条件,得到训练好的基于深度强化学习的导频决策模型。该模型能够根据信道时变的统计特性调整导频分布和功率来适应非平稳的信道特性,在保证信道估
一种基于深度强化学习的自适应众包方法.pdf
本发明公开了一种基于深度强化学习的自适应众包方法。方法具体为:1)首先从众包系统中采样需要分配的任务和候选的众包工人;2)通过深度学习方法获得待分配任务和候选工人的低维特征表示;3)通过强化学习方法确定任务分配策略;4)众包系统根据分配策略分配任务,根据任务完成结果评估本次分配获得的收益,将该收益反馈给强化学习方法,更新强化学习参数;5)从1)开始继续下一轮的任务分配。和现有技术相比,本发明结合了深度强化学习方法,系统地对任务分配问题进行建模,针对不同任务本身的特征选择合适的众包工人,形成了自适应的智能众
一种基于深度强化学习的帧级码率自适应控制方法.pdf
本发明提供了一种基于深度强化学习的帧级码率自适应控制方法,其步骤如下:(1)由内容提供端生成原始视频,并将原始视频划分为决策单元;(2)针对每个决策单元,利用神经网络根据当前的决策给出视频编码的量化参数值;然后对每个决策单元进行编码后打包传输;(3)视频发送端以帧为单位依次发送决策单元的视频流,接收端在本地维护一个接收缓冲区和一个播放缓冲区;(4)根据回传的状态信息计算用户体验质量,更新神经网络的参数,输出下一个量化参数的决策;(5)重复上述步骤(1)至(4),直至收敛到最优决策策略。本发明的方法直接对编
一种基于深度学习的自适应经济调度系统及方法.pdf
本发明公开了一种基于深度学习的自适应经济调度系统,其特征在于:它包括负荷矩阵构建模块、自适应学习模型及训练样本集构建模块、学习模型的训练目标构建模块、差异化训练样本集构建模块、长短期记忆网络构建模块和实时经济调度自适应学习模型构建模块;本发明基于完美调度理念生成学习模型训练目标,并利用系统中存储的海量历史数据对LSTM‑IIU网络对进行训练,一旦学习模型构建完成,将目标调度时刻的预测数据输入即可得到对应的实时经济调度方案。
一种QUIC协议下基于深度强化学习的视频流自适应传输方法.pdf
一种QUIC协议下基于深度强化学习的视频流自适应传输方法,结合基于门控循环单元(GRU)和卷积(CNN)的神经网络建立网络轨迹特征的提取模型,利用注意力机制学习不同特征对带宽的影响,预测未来时刻带宽信息;将预测的带宽信息作为码率决策的状态输入,建立QoE奖励模型,采用PPO算法训练强化学习网络,决策最优码率;客户端根据码率自适应决策模块的反馈结果将相应视频下载并播放,实现QUIC下的视频流自适应传输框架。本发明能够保证在QUIC协议下,带宽预测模块能够充分提取网络状态信息,实现长窗口的带宽预测,为码率自适