预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共20页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN115858913A(43)申请公布日2023.03.28(21)申请号202211358838.9(22)申请日2022.11.01(71)申请人清华大学地址100084北京市海淀区双清路30号清华大学清华园北京100084-82信箱(72)发明人李勇苑苑金德鹏(74)专利代理机构北京路浩知识产权代理有限公司11002专利代理师刘亚平(51)Int.Cl.G06F16/9535(2019.01)G06Q10/04(2023.01)G06N3/08(2023.01)G06N3/0464(2023.01)权利要求书2页说明书13页附图4页(54)发明名称仿真行为序列数据生成方法、装置、电子设备及存储介质(57)摘要本发明提供一种仿真行为序列数据生成方法、装置、电子设备及存储介质,其中,所述方法包括:基于嵌入网络构建当前时刻的个体状态,其中,所述个体状态包括随时间连续演化个体状态和瞬时跳变个体状态;基于当前时刻的所述个体状态,通过与所述个体状态对应的状态转移网络得到下一时刻的预测个体状态;将所述预测个体状态输入至策略函数网络,采样得到仿真行为序列数据。通过本发明提供的仿真行为序列数据生成方法,能够生成高质量的仿真行为序列数据,为高效训练预测或推荐模型打下基础。CN115858913ACN115858913A权利要求书1/2页1.一种仿真行为序列数据生成方法,其特征在于,所述方法包括:基于嵌入网络构建当前时刻的个体状态,其中,所述个体状态包括随时间连续演化个体状态和瞬时跳变个体状态;基于当前时刻的所述个体状态,通过与所述个体状态对应的状态转移网络得到下一时刻的预测个体状态;将所述预测个体状态输入至策略函数网络,采样得到仿真行为序列数据。2.根据权利要求1所述的仿真行为序列数据生成方法,其特征在于,所述状态转移网络包括与所述随时间连续演化个体状态对应的随时间连续演化状态转移网络,其中,所述随时间连续演化状态转移网络通过预训练机制训练得到,所述随时间连续演化状态转移网络包括第一多层感知器网络、第二多层感知器网络和Softplus激活层;所述随时间连续演化个体状态包括随时间连续演化个体需求状态和随时间连续演化历史行为影响状态;所述预测个体状态包括随时间连续演化预测个体需求状态和随时间连续演化预测历史行为影响状态;所述基于当前时刻的所述个体状态,通过与所述个体状态对应的状态转移网络得到下一时刻的预测个体状态,具体包括:将当前时刻的所述随时间连续演化个体需求状态输入至所述第一多层感知器网络,得到所述第一多层感知器网络输出的随时间连续演化个体需求状态变化率;基于当前时刻的所述随时间连续演化个体需求状态和所述随时间连续演化个体需求状态变化率,得到下一时刻的所述随时间连续演化预测个体需求状态;基于当前时刻的所述随时间连续演化历史行为影响状态,通过所述第二多层感知器网络级联所述Softplus激活层,得到随时间连续演化历史行为影响状态衰减率;基于当前时刻的所述随时间连续演化历史行为影响状态和所述随时间连续演化历史行为影响状态衰减率,得到下一时刻的所述随时间连续演化预测历史行为影响状态。3.根据权利要求1或2所述的仿真行为序列数据生成方法,其特征在于,所述状态转移网络包括与所述瞬时跳变个体状态对应的瞬时跳变状态转移网络,其中,所述瞬时跳变状态转移网络通过预训练机制训练得到,所述瞬时跳变状态转移网络包括第三多层感知器网络和第四多层感知器网络;所述瞬时跳变个体状态包括瞬时跳变个体需求状态和瞬时跳变历史行为影响状态;所述预测个体状态包括瞬时跳变预测个体需求状态和瞬时跳变预测历史行为影响状态;所述基于当前时刻的所述个体状态,通过与所述个体状态对应的状态转移网络得到下一时刻的预测个体状态,具体包括:将当前时刻的所述瞬时跳变个体需求状态输入至所述第三多层感知器网络,得到所述第三多层感知器网络输出的下一时刻的所述瞬时跳变预测个体需求状态;确定当前时刻的行为事件;将当前时刻的所述行为事件和当前时刻的所述瞬时跳变个体需求状态进行拼接,并将拼接后的当前时刻的所述行为事件和当前时刻的所述瞬时跳变个体需求状态输入至所述第四多层感知器网络,得到第四多层感知器网络输出的瞬时跳变历史行为影响状态变化量;基于当前时刻的所述瞬时跳变历史行为影响状态和所述瞬时跳变历史行为影响状态2CN115858913A权利要求书2/2页变化量,得到下一时刻的所述瞬时跳变预测历史行为影响状态。4.根据权利要求3所述的仿真行为序列数据生成方法,其特征在于,所述个体状态包括与生理需求对应的个体状态、与安全需求对应的个体状态,以及与精神需求对应的个体状态中的一种或多种,其中,所述生理需求、所述安全需求和所述精神需求根据马斯洛需求理论进行划分。5.