预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共13页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

一种基于优化样本采样的NOMA系统资源分配方法及存储介质,属于移动通信与无线网络技术领域。为了解决利用现有的深度强化学习网络对NOMA系统的资源进行分配时可能存在重要价值的样本没有被学习到的问题,以及导致的学习速率低的问题。本发明设计了以当前信道状态信息为输入、以用户总和速率为优化目标,以每个样本TD误差为优先级的基于样本优化池的深度强化学习网络,并利用其输出最优的用户分组策略,同时利用深度确定性策略梯度网络输出每个用户的最优分配功率。本发明通过引入样本的优先级提高了有价值样本的出现概率,可以提高深度强化学习网络的学习速率,加快收敛速度。主要用于NOMA系统的资源分配。