预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共19页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN115033823A(43)申请公布日2022.09.09(21)申请号202210689106.1(22)申请日2022.06.16(71)申请人北京百度网讯科技有限公司地址100085北京市海淀区上地十街10号百度大厦2层(72)发明人王安怡程珍珍(74)专利代理机构北京英赛嘉华知识产权代理有限责任公司11204专利代理师王达佐马晓亚(51)Int.Cl.G06F16/958(2019.01)G06F16/953(2019.01)G06F16/906(2019.01)权利要求书3页说明书11页附图4页(54)发明名称用于处理数据的方法、装置、设备、介质和产品(57)摘要本公开提供了用于处理数据的方法、装置、设备、介质和产品,涉及大数据技术领域,具体为数据处理技术领域。具体实现方案为:获取待处理数据;确定待处理数据对应的数据抽取类别;基于数据抽取类别,对待处理数据进行更新,得到更新后的待处理数据;基于更新后的待处理数据,确定目标聚合数据。本实现方式可以提高数据计算效率。CN115033823ACN115033823A权利要求书1/3页1.一种用于处理数据的方法,包括:获取待处理数据;确定所述待处理数据对应的数据抽取类别;基于所述数据抽取类别,对所述待处理数据进行更新,得到更新后的待处理数据;基于所述更新后的待处理数据,确定目标聚合数据。2.根据权利要求1所述的方法,其中,所述待处理数据至少包括分区日期数据、最新日期数据和数据标识;以及所述基于所述数据抽取类别,对所述待处理数据进行更新,得到更新后的待处理数据,包括:响应于所述数据抽取类别为预设的第一类别,确定第一待更新数据标识;响应于所述待处理数据中存在所述第一待更新数据标识,对所述第一待更新数据标识对应的分区日期数据和最新日期数据进行更新,得到所述更新后的待处理数据。3.根据权利要求2所述的方法,还包括:响应于所述待处理数据中不存在所述第一待更新数据标识,在所述待处理数据中新增所述第一待更新数据标识、所述第一待更新数据标识对应的分区日期数据以及所述第一待更新数据标识对应的最新日期数据,得到所述更新后的待处理数据。4.根据权利要求1所述的方法,其中,所述待处理数据至少包括分区日期数据和数据标识;以及所述基于所述数据抽取类别,对所述待处理数据进行更新,得到更新后的待处理数据,包括:响应于所述数据抽取类别为预设的第二类别,确定第二待更新数据标识;在所述待处理数据中新增所述第二待更新数据标识、所述第二待更新数据标识对应的分区日期数据,得到所述更新后的待处理数据。5.根据权利要求1所述的方法,其中,所述基于所述更新后的待处理数据,确定目标聚合数据,包括:确定所述待处理数据对应的初始聚合数据;基于所述初始聚合数据和所述更新后的待处理数据,确定所述目标聚合数据。6.根据权利要求5所述的方法,其中,所述基于所述初始聚合数据和所述更新后的待处理数据,确定所述目标聚合数据,包括:对所述更新后的待处理数据中的数据标识进行聚合,得到各个数据标识对应的标识聚合信息;基于所述更新后的待处理数据中的日期数据和所述标识聚合信息,确定更新聚合数据;基于所述初始聚合数据和所述更新聚合数据,确定所述目标聚合数据。7.根据权利要求1至6任一项所述的方法,还包括:响应于数据查询指令,从所述目标聚合数据中确定与所述数据查询指令相匹配的目标查询数据;输出所述目标查询数据。8.一种用于处理数据的装置,包括:2CN115033823A权利要求书2/3页数据获取单元,被配置成获取待处理数据;类别确定单元,被配置成确定所述待处理数据对应的数据抽取类别;数据更新单元,被配置成基于所述数据抽取类别,对所述待处理数据进行更新,得到更新后的待处理数据;数据聚合单元,被配置成基于所述更新后的待处理数据,确定目标聚合数据。9.根据权利要求8所述的装置,其中,所述待处理数据至少包括分区日期数据、最新日期数据和数据标识;以及所述数据更新单元进一步被配置成:响应于所述数据抽取类别为预设的第一类别,确定第一待更新数据标识;响应于所述待处理数据中存在所述第一待更新数据标识,对所述第一待更新数据标识对应的分区日期数据和最新日期数据进行更新,得到所述更新后的待处理数据。10.根据权利要求9所述的装置,其中,所述数据更新单元进一步被配置成:响应于所述待处理数据中不存在所述第一待更新数据标识,在所述待处理数据中新增所述第一待更新数据标识、所述第一待更新数据标识对应的分区日期数据以及所述第一待更新数据标识对应的最新日期数据,得到所述更新后的待处理数据。11.根据权利要求8所述的装置,其中,所述待处理数据至少包括分区日期数据和数据标识;以及所述数据更新单元进一步被配置成:响应于所述数据抽取类别为预