预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共23页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN114265959A(43)申请公布日2022.04.01(21)申请号202111368544.X(22)申请日2021.11.18(71)申请人奇安信科技集团股份有限公司地址100032北京市西城区新街口外大街28号102号楼3层332号申请人网神信息技术(北京)股份有限公司(72)发明人高建龙(74)专利代理机构北京中强智尚知识产权代理有限公司11448代理人王妍(51)Int.Cl.G06F16/903(2019.01)G06F16/901(2019.01)G06F21/60(2013.01)权利要求书2页说明书14页附图6页(54)发明名称数据标注方法及装置、存储介质、终端(57)摘要本发明公开了一种数据标注方法及装置、存储介质、终端,涉及数据处理技术领域,主要目的在于解决现有数据标注效率低的问题。包括:获取待标注的目标数据;通过规则引擎调取与所述目标数据匹配的数据标注规则,所述规则引擎中存储有与不同数据匹配的数据标注规则;基于所述数据标注规则对所述目标数据进行标注,得到所述目标数据的标注结果。主要用于数据标注。CN114265959ACN114265959A权利要求书1/2页1.一种数据标注方法,其特征在于,包括:获取待标注的目标数据;通过规则引擎调取与所述目标数据匹配的数据标注规则,所述规则引擎中存储有与不同数据匹配的数据标注规则;基于所述数据标注规则对所述目标数据进行标注,得到所述目标数据的标注结果。2.根据权利要求1所述的方法,其特征在于,所述规则引擎包括:规则管理器和规则执行器,所述通过规则引擎调取与所述目标数据匹配的数据标注规则之前,所述方法还包括:规则引擎中的规则管理器通过前端界面加载录入的规则执行需求信息,所述规则执行需求信息用于表征执行标注操作时的逻辑条件、以及规则运行方式、规则运行属性;在所述规则管理器中生成与所述规则执行需求信息匹配的数据标注规则;所述规则管理器向规则引擎中的规则执行器提交所述数据标注规则,以使所述规则执行器基于所述数据标注规则执行数据标注;和/或,规则引擎中的规则管理器通过前端界面接收初始数据标注规则,并对所述初始数据标注规则进行处理得到所述数据标注规则;所述规则管理器向规则引擎中的规则执行器提交所述数据标注规则,以使所述规则执行器基于所述数据标注规则执行数据标注。3.根据权利要求2所述的方法,其特征在于,所述在所述规则管理器中生成与所述规则执行需求信息匹配的数据标注规则包括:所述规则管理器对所述规则执行需求信息进行语法解析,得到规则逻辑信息;所述规则管理器对所述规则逻辑信息进行上下文逻辑识别,生成数据标注规则。4.根据权利要求2所述的方法,其特征在于,所述规则管理器向规则引擎中的规则执行器提交所述数据标注规则之后,所述方法还包括:所述规则执行器接收到所述规则管理器提交的所述数据标注规则后,确定每一所述数据标注规则能够执行标注的数据信息,所述数据信息包括:数据标识;将所述数据标注规则及相应的数据标识,关联存储至预设存储位置中;所述通过规则引擎调取与所述目标数据匹配的数据标注规则,包括:当所述规则执行器接收到标注任务时,解析所述标注任务,得到待标注的目标数据;基于所述待标注的目标数据的数据标识,调取所述预设存储位置中匹配的数据标注规则,并将所述标注任务及相应的数据标注规则,发送至任务集群中,以通过所述任务集群执行数据标注。5.根据权利要求4所述的方法,其特征在于,所述方法还包括:获取到待标注的目标数据后,为所述目标数据创建相应的标注任务,并将所述标注任务发送至所述任务集群中的任务管理器,以使所述任务管理器从所述任务集群中确定待标注任务的执行节点。6.根据权利要求4所述的方法,其特征在于,所述将所述标注任务及相应的数据标注规则,发送至任务集群中之后,所述方法还包括:确定任务集群中执行所述目标数据的标注任务的执行节点;通过所述规则引擎中的规则执行器将所述标注任务及相应的数据标注规则下发至所述执行节点,以通过所述执行节点基于所述数据标注规则对所述标注任务对应的目标数据2CN114265959A权利要求书2/2页进行标注。7.根据权利要求6所述的方法,其特征在于,所述确定任务集群中执行所述目标数据的标注任务的执行节点包括:从所述规则管理器中获取所述规则执行需求信息的规则执行配置信息,和/或从分布式数据源中获取所述目标数据的数据属性;通过所述规则执行器确定与所述规则执行配置信息、和/或所述数据属性对应执行所述标注任务的执行节点。8.一种数据标注装置,其特征在于,包括:获取模块,用于获取待标注的目标数据;调取模块,用于通过规则引擎调取与所述目标数据匹配的数据标注规则,所述规则引擎中存储有与不同数据匹配的数据标注规则