预览加载中,请您耐心等待几秒...
1/8
2/8
3/8
4/8
5/8
6/8
7/8
8/8

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN116028034A(43)申请公布日2023.04.28(21)申请号202211612865.4(22)申请日2022.12.15(71)申请人西安华讯科技有限责任公司地址710000陕西省西安市西安高新技术产业开发区丈八四路20号4幢12层(72)发明人李彬孙卫东温冬(74)专利代理机构西安泛想力专利代理事务所(普通合伙)61260专利代理师张涛(51)Int.Cl.G06F8/34(2018.01)G06F8/35(2018.01)权利要求书1页说明书5页附图1页(54)发明名称一种大数据预处理方法、系统、存储介质和终端(57)摘要本发明属于数据处理技术领域,具体公开了一种大数据预处理方法,包括:确定数据源预处理的任务类型以及预处理模型的功能组成;并进一步确定数据建模系统的组件算子拖拽轨迹形成流程可视化的预处理模型;基于预处理模型对数据源的部分数据进行预处理;判断预处理结果是否满足设计要求,若满足,则保存预处理模型为录制宏模型并保存模型元信息;若不满足,则重新进行预处理模型的构建;引入录制宏模型并且生成对应的模型元信息,对数据源进行数据处理并输出处理结果。本发明基于组件和流程图的方法进行拖拽式建模,零代码的方式进行图形化建模,将具体的功能封装在组件算子中,通过组件化进行处理数据,配置灵活,大大降低数据处理的门槛。CN116028034ACN116028034A权利要求书1/1页1.一种大数据预处理方法,其特征在于,包括:确定数据源预处理的任务类型,基于所述任务类型确定预处理模型的功能组成;基于所述功能组成确定数据建模系统的组件算子拖拽轨迹形成流程可视化的预处理模型;基于所述预处理模型对所述数据源的部分数据进行预处理并输出预处理结果;判断预处理结果是否满足设计要求,若满足,则保存所述预处理模型为录制宏模型并保存模型元信息;若不满足,则重新进行预处理模型的构建;引入所述录制宏模型并且生成对应的模型元信息,对所述数据源进行数据处理并输出处理结果。2.根据权利要求1所述的一种大数据预处理方法,其特征在于,所述模型元信息为所述录制宏模型的每个处理节点对应的处理动作。3.根据权利要求2所述的一种大数据预处理方法,其特征在于,所述处理动作至少包括创建数据库表结构、数据校验。4.根据权利要求1所述的一种大数据预处理方法,其特征在于,所述组件算子为封装有不同处理功能的单元;不同的所述处理功能响应于对应的所述处理节点。5.一种大数据预处理系统,其特征在于,包括:任务确定模块,用于确定数据源预处理的任务类型;功能确定模块,与任务确定模块相连接,基于任务类型确定预处理模型的功能组成;模型构建模块,与所述功能确定模块相连接,基于所述功能组成确定数据建模系统的组件算子拖拽轨迹形成流程可视化的预处理模型;数据源筛分单元:用于将数据源分为预处理模型处理数据和录制宏模型处理数据;验证模块,用于验证预处理结果是否满足设计要求,若满足,则保存所述预处理模型为录制宏模型并保存模型元信息;若不满足,则重新进行预处理模型的构建;存储模块:用于将预处理模型存储为录制宏模型并存储模型元信息。6.根据权利要求5所述的一种大数据预处理系统,其特征在于,所述模型元信息为所述录制宏模型的每个处理节点对应的处理动作。7.根据权利要求6所述的一种大数据预处理系统,其特征在于,所述处理动作至少包括创建数据库表结构、数据校验。8.根据权利要求5所述的一种大数据预处理系统,其特征在于,所述组件算子为封装有不同处理功能的单元;不同的所述处理功能响应于对应的所述处理节点。9.一种存储介质,其特征在于,所述存储介质存储有指令,所述指令被处理器执行时实现如权利要求1‑4任一项所述的大数据预处理方法。10.一种终端,其特征在于,包括存储器和处理器,所述存储器存储有指令,所述处理器加载所述指令以执行如权利要求1‑4任一项所述的大数据预处理方法。2CN116028034A说明书1/5页一种大数据预处理方法、系统、存储介质和终端技术领域[0001]本发明属于数据处理技术领域,特别涉及一种大数据预处理方法、系统、存储介质和终端。背景技术[0002]随着计算机和传感器的发展,现代企业的生产规模越来越大,自动化水平也越来越高。在生产过程中,传感器会实时监测到大量的数据,计算机通过对数据处理完成故障检测、故障预警等工作。[0003]在数据处理过程中,科研人员会开发多种计算处理模型实现数据的自动化快速处理,在此过程中,建模人员需要借用数据处理工具和机器学习工具,使用特定的语言,编写定制化的代码直接实现,并需要复杂的环境搭建与配置,才能完成完整的计算过程,更为重要的是,在数据处理时,不仅要进行计算还需要进行维护元信息,处理性能主要依赖于硬件及开发人