基于模型融合的牌型预测方法、装置、设备及存储介质-豆柴文库

基于模型融合的牌型预测方法、装置、设备及存储介质.pdf

2023-06-07

10金币

906KB

18页

书生****写意

实名认证

内容提供者

1/10

2/10

3/10

4/10

5/10

6/10

7/10

8/10

9/10

10/10

亲，该文档总共18页，到这已经超出免费预览范围，如果喜欢就直接下载吧～

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN115814428A(43)申请公布日2023.03.21(21)申请号202211427391.6G06N3/09(2023.01)(22)申请日2022.11.15G06N3/092(2023.01)(71)申请人重庆六花网络科技有限公司地址401120重庆市渝北区玉峰山镇玉龙大道188号(72)发明人魏新宇张攀陈伦广陈伟健罗勇刚(74)专利代理机构深圳市恒程创新知识产权代理有限公司44542专利代理师张小容(51)Int.Cl.A63F13/67(2014.01)G06F18/214(2023.01)G06F18/241(2023.01)G06N3/0464(2023.01)权利要求书2页说明书10页附图5页(54)发明名称基于模型融合的牌型预测方法、装置、设备及存储介质(57)摘要本发明属于棋牌游戏技术领域，公开了一种基于模型融合的牌型预测方法、装置、设备及存储介质。该方法包括：构建游戏环境；根据所述游戏规则与预设需求，确定奖励策略；获取当前牌局信息，根据所述当前牌局信息、奖励策略与强化学习模型，建立样本数据库；根据样本数据库对强化学习模型进行训练，建立对局模型；根据对局模型，得到对局数据；根据对局数据，对监督学习模型进行训练，得到牌型预测模型；根据目标牌局信息与牌型预测模型，得到预测数据，根据预测数据进行出牌。通过上述方式，利用强化学习从无到有的特性，结合监督学习的高效性，训练出最终的机器人模型，有效解决棋牌游戏机器人在新玩法中的冷启动问题，大幅降低项目运营成本。CN115814428ACN115814428A权利要求书1/2页1.一种基于模型融合的牌型预测方法，其特征在于，所述基于模型融合的牌型预测方法包括：构建游戏环境，所述游戏环境至少包括游戏规则和游戏流程；根据所述游戏规则与预设需求，确定奖励策略；获取当前牌局信息，根据所述当前牌局信息、奖励策略与强化学习模型，建立样本数据库；根据所述样本数据库对强化学习模型进行训练，建立对局模型；根据所述对局模型与游戏环境，得到对局数据；根据所述对局数据，对监督学习模型进行训练，得到牌型预测模型；根据目标牌局信息与所述牌型预测模型，得到预测数据，根据所述预测数据进行出牌。2.如权利要求1所述的方法，其特征在于，所述获取当前牌局信息，根据所述当前牌局信息、奖励策略与强化学习模型，建立样本数据库，包括：根据预设神经网络结构，建立强化学习模型；根据所述游戏流程与游戏规则初始化当前牌局，得到当前牌局信息；根据所述当前牌局信息、奖励策略与强化学习模型，确定当前出牌数据，并将所述当前出牌数据存储至自对弈数据库中；更新所述当前牌局信息，根据所述更新后的当前牌局信息，确定当前牌局是否结束；在所述当前牌局结束时，获取牌局结果数据，根据所述牌局结果数据与自对弈数据库确定当前样本数据；将所述当前样本数据存储至样本数据库中。3.如权利要求2所述的方法，其特征在于，所述根据所述当前牌局信息、奖励策略与强化学习模型，确定当前出牌数据，包括：根据预设数据格式对所述当前牌局信息进行转换，得到当前牌局数据；将所述当前牌局数据输入所述强化学习模型，得到初始出牌数据；根据所述奖励策略对所述初始出牌数据进行评分，得到出牌评分数据；根据所述出牌评分数据与初始出牌数据，确定当前出牌数据。4.如权利要求2所述的方法，其特征在于，所述更新所述当前牌局信息，根据所述更新后的当前牌局信息，确定当前牌局是否结束之后，还包括：在所述当前牌局未结束时，根据所述更新后的当前牌局信息，返回执行将当前牌局信息输入所述强化学习模型，得到初始出牌数据的步骤。5.如权利要求2所述的方法，其特征在于，所述根据所述样本数据库对所述强化学习模型进行训练，建立对局模型，包括：根据所述样本数据库，确定样本数量；在所述样本数量满足预设累积数量时，根据所述样本数据库中的样本数据对所述强化学习模型进行训练，得到新的强化学习模型，并记录迭代次数；在所述迭代次数大于等于预设迭代阈值时，根据所述新的强化学习模型，确定对局模型。6.如权利要求5所述的方法，其特征在于，所述根据所述样本数据库，确定样本数量之后，还包括：2CN115814428A权利要求书2/2页在所述样本数量不满足预设累积数量时，初始化所述自对弈数据库，返回执行根据所述游戏流程与游戏规则初始化牌局信息，得到当前牌局信息的步骤；所述在所述样本数量满足预设累积数量时，根据所述样本数据库中的样本数据对所述强化学习模型进行训练，得到新的强化学习模型，并记录迭代次数之后，还包括：在所述迭代次数小于预设迭代阈值时，初始化所述自对弈数据库，根据所述新的强化学习模型，返回执行根据所述游戏流程与游戏规则初始化牌局信息，得到当前牌局信息的步骤。7.如权利要求1

相关资料

基于模型融合的牌型预测方法、装置、设备及存储介质.pdf

本发明属于棋牌游戏技术领域，公开了一种基于模型融合的牌型预测方法、装置、设备及存储介质。该方法包括：构建游戏环境；根据所述游戏规则与预设需求，确定奖励策略；获取当前牌局信息，根据所述当前牌局信息、奖励策略与强化学习模型，建立样本数据库；根据样本数据库对强化学习模型进行训练，建立对局模型；根据对局模型，得到对局数据；根据对局数据，对监督学习模型进行训练，得到牌型预测模型；根据目标牌局信息与牌型预测模型，得到预测数据，根据预测数据进行出牌。通过上述方式，利用强化学习从无到有的特性，结合监督学习的高效性，训练出

2023-06-07

906KB

基于模型融合的来访量预测方法、装置、设备及存储介质.pdf

本发明提供一种基于模型融合的来访量预测方法、装置、设备及存储介质，其中，方法提取各楼盘的基本数据，并且连接服务器获取天气数据，对基本数据和天气数据进行预处理后，分别输入时间序列模型和LightGBM回归模型中，得到各自的来访量预测值，最终将两个模型融合，并直接求两个来访量预测值的平均值，得到目标来访量预测值，从而实现对楼盘来访量的预测，并可以适当调整营销模式以及人员安排，进一步提高销售的工作效率以及楼盘的销售业绩。

2023-07-25

494KB

基于预测模型融合的电池寿命预测方法及存储介质.pdf

本发明提供了一种基于预测模型融合的电池寿命预测方法及存储介质，所述电池寿命预测方法将长短记忆网络模型嵌套于粒子滤波模型之中，融合模型结构简单，用已有历史数据训练长短记忆网络模型得到退化趋势方程确定粒子滤波模型的的状态转移方程，解决了粒子滤波模型过于依赖经验模型的问题，粒子滤波模型利用粒子的加权和逼近容量的预测值，能得到剩余寿命的不确定表达，此外，将在线获得的新样本增加到原有训练样本集中重新训练模型，使得模型参数更新及时，有更好的适应性，可以实现镉镍蓄电池剩余循环寿命预测。

2023-08-09

793KB

业务预测模型构建方法、装置、设备及存储介质.pdf

本申请提供一种业务预测模型构建方法、装置、设备及存储介质。该方法包括:获取多个用户的业务样本数据;每个用户的业务样本数据包括M个业务行为特征,M为大于或等于2的整数;确定M个业务行为特征中每个业务行为特征的信息值;信息值用于表示业务行为特征对用户进行目标业务的预测能力的贡献程度;根据M个业务行为特征的信息值,从M个业务行为特征中筛选出信息值满足预设要求的K个业务行为特征;K为大于或等于1,且小于M的整数;根据K个业务行为特征的信息值和K个业务行为特征对应的业务样本数据构建业务预测模型;业务预测模型用于预测

2023-05-09

1.2MB

一种基于多模型融合的交易额预测方法、装置及存储介质.pdf

本申请公开一种基于多模型融合的交易额预测方法、装置及存储介质，涉及信息技术与计算机技术领域，用于提高交易额预测的准确性。该方法包括：获取目标设备关系网络图；其中，目标设备关系网络图用于表征多个目标设备之间的相似性，目标设备关系网络图中的节点包括多个目标设备的标识，相似度大于阈值的两个目标设备之间存在连边，连边的权重为连边的两个目标设备之间的相似度，多个目标设备包括第一目标设备；根据目标设备关系网络图，采用图挖掘法，确定第一目标设备的关系属性特征；确定第一目标设备的统计特征；至少根据第一目标设备的关系属性特

2023-07-24

988KB