一种基于深度强化学习的自适应众包方法.pdf
fu****级甜
在线预览结束,喜欢就下载吧,查找使用更方便
相关资料
一种基于深度强化学习的自适应众包方法.pdf
本发明公开了一种基于深度强化学习的自适应众包方法。方法具体为:1)首先从众包系统中采样需要分配的任务和候选的众包工人;2)通过深度学习方法获得待分配任务和候选工人的低维特征表示;3)通过强化学习方法确定任务分配策略;4)众包系统根据分配策略分配任务,根据任务完成结果评估本次分配获得的收益,将该收益反馈给强化学习方法,更新强化学习参数;5)从1)开始继续下一轮的任务分配。和现有技术相比,本发明结合了深度强化学习方法,系统地对任务分配问题进行建模,针对不同任务本身的特征选择合适的众包工人,形成了自适应的智能众
一种基于深度学习的软件众包任务推荐方法.pdf
本发明公开了一种基于深度学习的软件众包任务推荐方法。目前已有很多相关研究提出使用深度学习的方法对众包任务文本信息来进行众包任务推荐,但在现有的方法中,众包任务文本信息的提取方法缺乏通用性,且由于众包数据分布不平衡的特点,在推荐结果的指标上,命中率与多样性无法兼顾。本发明方法包含三部分的内容:基于预训练模型Bert提取众包文本特征、基于CNN+LSTM对众包文本特征进行进一步的特征学习和基于上述两个模型作用下的输出,能够自适应克服众包数据分布不平衡的损失函数。通过本发明可以在简单高效地针对特定软件众包平台实
一种基于深度强化学习的自适应导频方法.pdf
本发明公开了一种基于深度强化学习的自适应导频方法,方法包括:发送端获取接收端返回的信道统计信息;基于信道统计信息,利用预训练好的基于深度强化学习的导频决策模型进行决策,得到导频决策结果;根据所述导频决策结果,调整时‑频域的导频间距和导频功率;其中所述基于深度强化学习的导频决策模型包括两个结构相同的评估神经网络和目标神经网络;采用ε‑greedy贪婪算法来进行训练至达到预设条件,得到训练好的基于深度强化学习的导频决策模型。该模型能够根据信道时变的统计特性调整导频分布和功率来适应非平稳的信道特性,在保证信道估
一种基于深度强化学习的帧级码率自适应控制方法.pdf
本发明提供了一种基于深度强化学习的帧级码率自适应控制方法,其步骤如下:(1)由内容提供端生成原始视频,并将原始视频划分为决策单元;(2)针对每个决策单元,利用神经网络根据当前的决策给出视频编码的量化参数值;然后对每个决策单元进行编码后打包传输;(3)视频发送端以帧为单位依次发送决策单元的视频流,接收端在本地维护一个接收缓冲区和一个播放缓冲区;(4)根据回传的状态信息计算用户体验质量,更新神经网络的参数,输出下一个量化参数的决策;(5)重复上述步骤(1)至(4),直至收敛到最优决策策略。本发明的方法直接对编
一种基于深度学习的自适应经济调度系统及方法.pdf
本发明公开了一种基于深度学习的自适应经济调度系统,其特征在于:它包括负荷矩阵构建模块、自适应学习模型及训练样本集构建模块、学习模型的训练目标构建模块、差异化训练样本集构建模块、长短期记忆网络构建模块和实时经济调度自适应学习模型构建模块;本发明基于完美调度理念生成学习模型训练目标,并利用系统中存储的海量历史数据对LSTM‑IIU网络对进行训练,一旦学习模型构建完成,将目标调度时刻的预测数据输入即可得到对应的实时经济调度方案。