预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共15页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN109284776A(43)申请公布日2019.01.29(21)申请号201810974270.0(22)申请日2018.08.24(71)申请人小沃科技有限公司地址201712上海市杨浦区大连路688号宝地广场A座21F申请人上海交通大学(72)发明人骆源徐彬方品应臣浩(74)专利代理机构上海光华专利事务所(普通合伙)31219代理人庞红芳(51)Int.Cl.G06K9/62(2006.01)G06N99/00(2019.01)权利要求书2页说明书9页附图3页(54)发明名称用于防沉迷系统的基于随机森林的自训练学习系统及方法(57)摘要本发明提供一种用于防沉迷系统的基于随机森林的自训练学习系统及方法,所述方法包括:对至少一个已标记的游戏特征序列进行PCA训练获得游戏特征序列训练集;基于随机森林的分类器对未标记的游戏特征序列进行识别,将置信度最高的未标记的游戏特征序列添加到所述游戏特征序列训练集;重新对所述游戏特征序列训练集的数据进行PCA训练,直至达到预设循环次数或所述游戏特征序列训练集不再增大;利用所述游戏特征序列训练集对输入的测试游戏特征序列进行识别。本发明提供的基于随机森林的自学习方法,用于解决防沉迷系统中大量游戏序列数据无标记的问题,通过利用大量的未标记游戏序列数据和少量的标记游戏序列数据共同构建更好的分类器。CN109284776ACN109284776A权利要求书1/2页1.一种用于防沉迷系统的基于随机森林的自训练学习方法,其特征在于,所述用于防沉迷系统的基于随机森林的自训练学习方法包括:对至少一个已标记的游戏特征序列进行PCA训练获得游戏特征序列训练集;基于随机森林的分类器对未标记的游戏特征序列进行识别,将置信度最高的未标记的游戏特征序列添加到所述游戏特征序列训练集;重新对所述游戏特征序列训练集的数据进行PCA训练,直至达到预设循环次数或所述游戏特征序列训练集不再增大;利用所述游戏特征序列训练集对输入的测试游戏特征序列进行识别。2.根据权利要求1所述的用于防沉迷系统的基于随机森林的自训练学习方法,其特征在于,所述用于防沉迷系统的基于随机森林的自训练学习方法还包括:对输入的游戏序列数据进行提取,分别获取所述已标记的游戏特征序列和所述未标记的游戏特征序列。3.根据权利要求1或2所述的用于防沉迷系统的基于随机森林的自训练学习方法,其特征在于,所述游戏序列数据的游戏特征至少包括游戏时间和游戏金额。4.根据权利要求1所述的用于防沉迷系统的基于随机森林的自训练学习方法,其特征在于,所述基于随机森林的分类器对未标记的游戏特征序列进行识别,将置信度最高的未标记的游戏特征序列添加到所述游戏特征序列训练集的一种实现方式包括:利用随机森林的分类器来计算每个未标记的游戏特征序列的假标记,形成属于某一类的假标记集;从所述假标记集中选取一个与所述某一类同类的有标记的游戏特征序列距离最近的未标记的游戏特征序列;将该距离最近的所述未标记的游戏特征序列添加到所述游戏特征序列训练集。5.根据权利要求1所述的用于防沉迷系统的基于随机森林的自训练学习方法,其特征在于,所述随机森林的分类器的一种形式为:(t)C=RandomForest(DL,DecisionTree,N);(t)其中,C为分类器的输出分类结果,DL为标记的游戏特征序列训练集,DecisionTree为子决策树,N为子决策树的个数,RandomForest为随机森林算法。6.一种用于防沉迷系统的基于随机森林的自训练学习系统,其特征在于,所述用于防沉迷系统的基于随机森林的自训练学习系统包括:PCA训练模块,用于对至少一个已标记的游戏特征序列进行PCA训练获得游戏特征序列训练集;识别模块,用于基于随机森林的分类器对未标记的游戏特征序列进行识别,将置信度最高的未标记的游戏特征序列添加到所述游戏特征序列训练集;所述训练集模块重新对所述游戏特征序列训练集的数据进行PCA训练,直至达到预设循环次数或所述游戏特征序列训练集不再增大;测试模块,用于利用所述游戏特征序列训练集对输入的测试游戏特征序列进行识别。7.根据权利要求6所述的用于防沉迷系统的基于随机森林的自训练学习系统,其特征在于,所述用于防沉迷系统的基于随机森林的自训练学习系统还包括:特征提取模块,用于对输入的游戏序列数据进行提取,分别获取所述已标记的游戏特2CN109284776A权利要求书2/2页征序列和所述未标记的游戏特征序列。8.根据权利要求6或7所述的用于防沉迷系统的基于随机森林的自训练学习系统,其特征在于,所述游戏序列数据的游戏特征至少包括游戏时间和游戏金额。9.根据权利要求6所述的用于防沉迷系统的基于随机森林的自训练学习系统,其特征在于,所述识别模块