多智能体协作信息处理方法、系统、存储介质、智能终端-豆柴文库

多智能体协作信息处理方法、系统、存储介质、智能终端.pdf

2023-11-13

10金币

2.2MB

30页

灵慧****89

实名认证

内容提供者

1/10

2/10

3/10

4/10

5/10

6/10

7/10

8/10

9/10

10/10

亲，该文档总共30页，到这已经超出免费预览范围，如果喜欢就直接下载吧～

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN111582469A(43)申请公布日2020.08.25(21)申请号202010211670.3(22)申请日2020.03.23(71)申请人成都信息工程大学地址610225四川省成都市西南航空港经济开发区学府路一段24号(72)发明人邹长杰郑皎凌张中雷(74)专利代理机构北京元本知识产权代理事务所(普通合伙)11308代理人王红霞(51)Int.Cl.G06N3/08(2006.01)G06N3/02(2006.01)G06N20/00(2019.01)权利要求书4页说明书16页附图9页(54)发明名称多智能体协作信息处理方法、系统、存储介质、智能终端(57)摘要本发明属于人工智能技术领域，公开了一种多智能体协作信息处理方法、系统、存储介质、智能终端，每个agent在环境中每采取下一步行为在环境中留下自己的信息微量，当其它agent到达环境中状态时会先搜索周围的信息微量，把信息微量加入到神经网络中进行训练；分组模型找到多智能体之间更好的合作策略，分组模型使用多智能体之间的分组关系，预测出多智能体在下一时刻的最优分组；在每次经过G模型训练一回合结束时，把每个agent的损失函数公式看作适应度，统计每一回合智能体轨迹的损失值均值，汇总每一回合所有agent轨迹的损失值。本发明提高了多智能体的团队学习效率，实现多智能体能够团队协作更好的完成任务。CN111582469ACN111582469A权利要求书1/4页1.一种多智能体协作信息处理方法，其特征在于，所述多智能体协作信息处理方法包括以下步骤：第一步，每个agent在环境中每采取下一步行为在环境中留下自己的信息微量，当其它agent到达环境中这个状态时会先搜索周围的信息微量，把信息微量加入到神经网络中进行训练；第二步，分组模型找到多智能体之间更好的合作策略，分组模型使用RNN网络设计出多智能体之间的分组关系，称为G模型，并且通过G模型能够预测出多智能体在下一时刻的最优分组；第三步，在每次经过G模型训练一回合结束时，把每个agent的损失函数公式看作适应度，统计每一回合智能体轨迹的损失值均值，汇总每一回合所有agent轨迹的损失值。2.如权利要求1所述的多智能体协作信息处理方法，其特征在于，所述第一步每个agent在环境中每采取下一步行为在环境中留下自己的信息微量，当其它agent到达环境中这个状态时会先搜索周围的信息微量，把信息微量加入到神经网络中进行训练具体包括：n×n智能体agenti的信息微量Xi，信息微量用x表示，X＝R到其中n×n表示环境大小；x′i＝xi+Δs；Agenti每到达下一个状态都会更新信息微量表中对应状态的数量值，Δs表示agenti到达对应状态记为1，否则记为0；所有agent信息微量汇总方式如下：xall＝λ1x1+λ2x2+…+λnxn；λi是xi的权重，如果agenti在一回合内完成目标，那么信息微量xi就是正反馈λi＝1，反之λi＝-1；每回合结束后环境中的信息微量汇总xall，对汇总表xall的信息微量进行归一化，两个智能体agent1和agent2，x1和x2过程如下：x1+x2＝xall；得到xall后对其归一化，当agenti到达xall中某一状态是获取周围4个方向的信息微量数值，放到actor中训练，在训练过程中agenti利用这四个数值优化行为策略，在学习过程中agenti会朝信息微量相对多的方向行动的概率会增大。3.如权利要求1所述的多智能体协作信息处理方法，其特征在于，所述第二步组队策略Gt，使用分组模型找到多智能体之间更好的合作策略，分组模型使用RNN网络设计出多智能体之间的分组关系，称为G模型，并且通过G模型能够预测出多智能体在下一时刻的最优分2CN111582469A权利要求书2/4页组；每个agent通过自己的Actor网络选出下一步行为a，通过Critic网络更新Actor策略，经过G模型的组队，agent1和agent3组队训练Critic1网络，agent2和agent1、agent3组队训练Critic2网络，agent3和agent2组队训练Critic3网络用有向图表示agent组队。4.如权利要求3所述的多智能体协作信息处理方法，其特征在于，所述Gt定义；多智能体n×n分组模型Gt＝R，其中n表示智能体的个数：G表示一个n×n的所有智能体组队矩阵，Gt表示t时刻的组队矩阵，用矩阵存储多智能体的组队情况，agent不能和自己连接，Gt(i)表示t时刻agenti和其它智能体的组队情况：5.如权利要求3所述的多智能体协作信息处理方法，其特征在于，通过Gt预测Gt+1，通过Gt构造拟合模型，将Gt输入该模型，得到Gt+1。6.如权

相关资料

多智能体协作信息处理方法、系统、存储介质、智能终端.pdf

本发明属于人工智能技术领域，公开了一种多智能体协作信息处理方法、系统、存储介质、智能终端，每个agent在环境中每采取下一步行为在环境中留下自己的信息微量，当其它agent到达环境中状态时会先搜索周围的信息微量，把信息微量加入到神经网络中进行训练；分组模型找到多智能体之间更好的合作策略，分组模型使用多智能体之间的分组关系，预测出多智能体在下一时刻的最优分组；在每次经过G模型训练一回合结束时，把每个agent的损失函数公式看作适应度，统计每一回合智能体轨迹的损失值均值，汇总每一回合所有agent轨迹的损失值

2023-11-13

2.2MB

信息处理方法、智能终端及存储介质.pdf

本申请提供一种信息处理方法、智能终端及存储介质，信息处理方法包括步骤：确定用户在预设时间段之后所处的第一位置；确定与所述第一位置对应的目标处理信息；在所述用户到达所述第一位置之前，输出所述目标处理信息。通过上述技术方案，在用户到达第一位置之前，提前对用户进行目标处理信息的处理，使得用户可以提前知晓相关信息，便于用户预先进行相应的准备工作，从而提高提示信息的提示效果，提升用户体验。

2023-07-24

851KB

智能提醒方法、装置、存储介质及智能终端.pdf

本申请实施例公开了一种智能提醒方法、装置、存储介质及智能终端。该方法包括：获取正在被烹饪的食材的图像，识别所述图像确定所述食材的类型；根据所述类型确定所述食材的烹饪时间，根据所述烹饪时间设置闹钟；在达到所述烹饪时间时，控制所述闹钟响铃，以提示用户关闭灶具，解决用户因故离开厨房而忘记关闭灶具而存在安全隐患的问题，可以根据食材烹饪时间自动设置闹钟，丰富了智能终端的功能。

2023-10-23

643KB

终端控制方法、智能终端及存储介质.pdf

本申请提出了一种终端控制方法、智能终端及存储介质，该方法包括以下步骤：获取所述智能终端的状态信息，根据所述状态信息确定目标震动模式；根据所述目标震动模式控制所述智能终端的震动模块。本申请在确定终端的状态信息后，根据状态信息确定目标震动模式，并根据目标震动模式控制震动模块进行震动，解决了现有震动功能较为固化，用户无法进行自定义，用户体验单调的问题，提升了用户体验。

2023-07-21

660KB

智能终端的录屏方法、系统、智能终端及计算机可读存储介质.pdf

本发明提供了一种智能终端的录屏方法、系统、智能终端及计算机可读存储介质，录屏方法包括：应用对象生成录屏信号；编解码模块创建编码器对象；通过编码器对象创建数据输入对象；显示管理模块创建至少一个虚拟显示单元，具有数据输出对象；选定数据输入对象为数据输出对象的输出目标，数据输出对象于数据输入对象上渲染显示管理模块的显示内容；编码器对象读取数据输入对象内显示内容，以获得屏幕编码数据；音视频数据封装模块对屏幕编码数据封装，以形成音视频数据。采用上述技术方案后，可支持安卓手机在对屏幕显示内容作提取以共享直播的同时，也

2024-01-06

621KB