预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共12页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN115994584A(43)申请公布日2023.04.21(21)申请号202111210540.9(22)申请日2021.10.18(71)申请人北京嘀嘀无限科技发展有限公司地址100193北京市海淀区东北旺西路8号(72)发明人刘佳宁付聪慧倪泽天易子涵(74)专利代理机构北京市金杜律师事务所11256专利代理师马明月(51)Int.Cl.G06N20/00(2019.01)权利要求书1页说明书7页附图3页(54)发明名称机器学习模型构建的方法、装置、设备、介质和程序产品(57)摘要根据本公开的实施例提供一种机器学习模型构建的方法、装置、设备、介质和程序产品。在该方法中,将从数据源获取的第一格式的第一数据转换为第二格式的第二数据。第一格式属于预定的多种可读取格式。继而,对第二数据进行验证,并且使用经验证的第二数据来构建机器学习模型。由此,实现了数据读取、数据验证和模型构建的多个过程的集成,而且可以读取和利用多种格式的数据来构建学习模型,从而提高了机器学习模型构建效率以及机器学习模型的性能。CN115994584ACN115994584A权利要求书1/1页1.一种计算机实现的方法,包括:将从数据源获取的第一格式的第一数据,转换为第二格式的第二数据,所述第一格式属于预定的多种可读取格式;对所述第二数据进行验证;以及使用经验证的所述第二数据来构建机器学习模型。2.根据权利要求1所述的方法,其中对所述第二数据进行验证包括:检测所述第二数据与参考数据之间的偏差;以及基于所述偏差超过阈值偏差,确定所述第二数据存在异常。3.根据权利要求2所述的方法,还包括:响应于所述第二数据存在异常,触发关于所述第二数据存在异常的告警。4.根据权利要求1所述的方法,还包括:基于以下至少一项确定所述第一数据存在异常:所述第一数据不可读、所述第一数据的数量低于阈值数量;以及触发关于所述第一数据存在异常的告警。5.根据权利要求1所述的方法,其中对所述第二数据进行验证包括:针对所述第二数据执行可配置的多个验证任务。6.根据权利要求5所述的方法,其中所述可配置的多个验证任务是定期执行的。7.一种用于构建机器学习模型的装置,包括:数据读取模块,被配置为将从数据源获取的第一格式的第一数据,转换为第二格式的第二数据,所述第一格式属于预定的多种可读取格式;数据验证模块,被配置为对所述第二数据进行验证;以及模型构建模块,被配置为使用经验证的所述第二数据来构建机器学习模型。8.一种电子设备,包括:存储器和处理器;所述存储器用于存储程序指令,所述程序指令被所述处理器执行以实现根据权利要求1至6中任一项所述的方法。9.一种计算机可读存储介质,其上存储有程序指令,所述程序指令被处理器执行以实现根据权利要求1至6中任一项所述的方法。10.一种计算机程序产品,包括程序指令,所述程序指令被处理器执行时实现权利要求1至6中任一项所述的方法。2CN115994584A说明书1/7页机器学习模型构建的方法、装置、设备、介质和程序产品技术领域[0001]本公开的各实施例涉及计算机技术领域,更具体地,涉及机器学习模型构建的方法、装置、设备、介质和程序产品。背景技术[0002]当前,机器学习过程在很多领域都有非常广泛的应用。在机器学习过程中,机器学习模型可以模拟人类的学习过程,基于输入的数据不断训练和更新。使用经过训练的机器学习模型可以执行自然语言处理、图像和/或语音识别、医学诊断等等各种各样的任务。构建机器学习模型的过程通常包括数据预处理、数据验证、模型架构设计、超参数配置和模型验证等多个过程,这些过程需要统一并集成地执行。发明内容[0003]本公开的实施例提供了一种机器学习模型构建的方法、装置、设备、介质和程序产品。[0004]在本公开的第一方面,提供了一种计算机实现的方法。在该方法中,将从数据源获取的第一格式的第一数据,转换为第二格式的第二数据,第一格式属于预定的多种可读取格式。继而,对第二数据进行验证,并且使用经验证的第二数据来构建机器学习模型。[0005]在本公开的第二方面,提供了一种用于构建机器学习模型的装置。装置包括数据读取模块,被配置为将从数据源获取的第一格式的第一数据,转换为第二格式的第二数据,第一格式属于预定的多种可读取格式。装置还包括数据验证模块,其被配置为对第二数据进行验证。而且,装置包括模型构建模块,其被配置为使用经验证的第二数据来构建机器学习模型。[0006]在本公开的第三方面,提供了一种电子设备,包括:存储器和处理器;存储器用于存储程序指令,程序指令被处理器执行以实现根据本公开的第一方面的方法。[0007]在本公开的第四方面,提供了一种计算机可读存储介质,其上存储有程序指令,程序指令被处理器执行以实现根据本