预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共12页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN109242165A(43)申请公布日2019.01.18(21)申请号201810973101.5(22)申请日2018.08.24(71)申请人蜜小蜂智慧(北京)科技有限公司地址100082北京市西城区新街口外大街28号B座5层508号(72)发明人曾伟雄(74)专利代理机构北京同达信恒知识产权代理有限公司11291代理人黄志华(51)Int.Cl.G06Q10/04(2012.01)G06Q40/02(2012.01)G06N3/04(2006.01)G06K9/62(2006.01)权利要求书2页说明书7页附图2页(54)发明名称一种模型训练及基于模型训练的预测方法及装置(57)摘要本发明公开了一种模型训练及基于模型训练的预测方法及装置,所述方法包括:依次针对包含至少两层子模型的待训练模型的每层子模型,识别该层子模型是否为最后一层子模型;如果否,将训练集中已包含正或负样本标签的每个样本数据输入到该层子模型中,对该层子模型进行训练;并基于训练完成的该层子模型输出训练集中每个样本数据对应正样本数据的置信度,采用训练集中对应正样本数据的置信度大于该层子模型对应的置信度阈值的样本数据,对训练集中的样本数据进行更新;如果是,将训练集中已包含正或负样本标签的每个样本数据输入到该层子模型中,对该层子模型进行训练,用以提高模型预测的精度。CN109242165ACN109242165A权利要求书1/2页1.一种模型训练方法,其特征在于,所述方法包括:依次针对待训练模型的每层子模型,识别该层子模型是否为所述待训练模型的最后一层子模型,其中所述待训练模型包含至少两层子模型;如果否,将训练集中已包含正样本或负样本标签的每个样本数据输入到该层子模型中,对该层子模型进行训练;并基于训练完成的该层子模型输出训练集中每个样本数据对应正样本数据的置信度,采用所述训练集中对应正样本数据的置信度大于该层子模型对应的置信度阈值的样本数据,对所述训练集中的样本数据进行更新;如果是,将训练集中已包含正样本或负样本标签的每个样本数据输入到该层子模型中,对该层子模型进行训练。2.如权利要求1所述的方法,其特征在于,所述将训练集中已包含正样本或负样本标签的每个样本数据输入到该层子模型中,对该层子模型进行训练之前,所述方法还包括:判断所述训练集中样本数据的数量是否大于设定的数量阈值;如果是,进行后续步骤;如果否,发出告警信息。3.一种基于权利要求1-2任一项所述的模型训练方法的预测方法,其特征在于,所述方法包括:将待检测数据输入到训练完成的模型中;基于所述训练完成的模型,输出预测所述待检测数据是否为正样本数据的结果。4.如权利要求3所述的方法,其特征在于,如果预测所述待检测数据为正样本数据,所述方法还包括:发出告警信息。5.一种模型训练装置,其特征在于,所述装置包括:识别模块,用于依次针对待训练模型的每层子模型,识别该层子模型是否为所述待训练模型的最后一层子模型,其中所述待训练模型包含至少两层子模型;训练模块,用于如果子模型为非所述待训练模型的最后一层子模型,将训练集中已包含正样本或负样本标签的每个样本数据输入到该层子模型中,对该层子模型进行训练;并基于训练完成的该层子模型输出训练集中每个样本数据对应正样本数据的置信度,采用所述训练集中对应正样本数据的置信度大于该层子模型对应的置信度阈值的样本数据,对所述训练集中的样本数据进行更新;训练模块,还用于如果子模型为所述待训练模型的最后一层子模型,将训练集中已包含正样本或负样本标签的每个样本数据输入到该层子模型中,对该层子模型进行训练。6.如权利要求5所述的装置,其特征在于,所述装置还包括:判断报警模块,用于判断所述训练集中样本数据的数量是否大于设定的数量阈值,并在判断结果为是时,触发训练模块,在判断结果为否时,发出告警信息。7.一种基于权利要求5-6任一项所述的模型训练装置的预测装置,其特征在于,所述装置包括:输入模块,用于将待检测数据输入到训练完成的模型中;输出模块,用于基于所述训练完成的模型,输出预测所述待检测数据是否为正样本数据的结果。2CN109242165A权利要求书2/2页8.如权利要求7所述的装置,其特征在于,所述装置还包括:报警模块,用于如果预测所述待检测数据为正样本数据,发出告警信息。3CN109242165A说明书1/7页一种模型训练及基于模型训练的预测方法及装置技术领域[0001]本发明涉及大数据科学技术领域,尤其涉及一种模型训练及基于模型训练的预测方法及装置。背景技术[0002]随着经济与信息化的高速发展,大数据应运而生,大数据指的是一种规模达到在获取、存储、管理、分析等方面大大超出传统数据库软件工具能力范围的数据集合,通