预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共18页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN115858699A(43)申请公布日2023.03.28(21)申请号202310174743.X(22)申请日2023.02.28(71)申请人北京仁科互动网络技术有限公司地址100022北京市朝阳区建外大街甲6号SK大厦8层(72)发明人张志勇阮东东(74)专利代理机构北京路浩知识产权代理有限公司11002专利代理师张晓霞(51)Int.Cl.G06F16/28(2019.01)G06F16/2458(2019.01)G06N3/088(2023.01)权利要求书2页说明书10页附图5页(54)发明名称数据仓库的构建方法、装置、电子设备和可读存储介质(57)摘要本发明提供一种数据仓库的构建方法、装置、电子设备和可读存储介质,涉及数据处理技术领域,该方法包括:获取原始星型模型对应的视图属性信息,视图属性信息包括原始星型模型中的视图数量以及每个视图对应的视图属性参数;获取应用原始星型模型后得到的模型应用统计信息,模型应用统计信息包括原始星型模型中的每一组字段数据所对应的字段应用统计参数;基于视图数量、视图属性参数和字段应用统计参数对原始星型模型进行优化,得到优化后的目标星型模型,并将优化后的目标星型模型确定为目标数据仓库,以解决现有技术中数据仓库的数据处理效果差的技术问题。CN115858699ACN115858699A权利要求书1/2页1.一种数据仓库的构建方法,其特征在于,包括:获取原始星型模型对应的视图属性信息,所述原始星型模型基于租户对应的第一实体数据以及C端用户对应的第二实体数据构建,所述视图属性信息包括所述原始星型模型中的视图数量以及每个视图对应的视图属性参数;获取应用所述原始星型模型后得到的模型应用统计信息,所述模型应用统计信息包括所述原始星型模型中的每一组字段数据所对应的字段应用统计参数;基于所述视图数量、所述视图属性参数和所述字段应用统计参数对所述原始星型模型进行优化,得到优化后的目标星型模型,并将优化后的目标星型模型确定为目标数据仓库。2.根据权利要求1所述的数据仓库的构建方法,其特征在于,所述视图属性参数包括所述视图对应的视图数据量和视图结构复杂度;所述字段应用统计参数包括所述字段数据对应的字段使用频率和字段查询时长;所述基于所述视图数量、所述视图属性参数和所述字段应用统计参数对所述原始星型模型进行优化,包括:基于所述视图数量、所述视图数据量、所述视图结构复杂度和所述字段使用频率,对所述原始星型模型进行逻辑优化;和/或,基于所述视图数据量、所述视图结构复杂度、所述字段查询时长和所述字段使用频率,对所述原始星型模型进行存储优化。3.根据权利要求2所述的数据仓库的构建方法,其特征在于,所述基于所述视图数量、所述视图数据量、所述视图结构复杂度和所述字段使用频率,对所述原始星型模型进行逻辑优化,包括:以降低所述视图数量、所述视图数据量以及所述视图结构复杂度的数值为逻辑优化目标,以所述字段使用频率为逻辑优化参数,构建逻辑优化模型;基于所述逻辑优化模型对所述原始星型模型进行迭代优化,直至所述视图数量、所述视图数据量以及所述视图结构复杂度的每一个参数的当前数值均小于其对应的数值阈值。4.根据权利要求3所述的数据仓库的构建方法,其特征在于,所述字段数据包括单一字段数据和组合字段数据中的至少之一,所述单一字段数据由一个字段的数据构成,所述组合字段数据由至少两个字段的数据构成;所述基于所述逻辑优化模型对所述原始星型模型进行迭代优化,包括:在所述视图数量、所述视图数据量以及所述视图结构复杂度中的至少一个参数的当前数值大于其对应的数值阈值的情况下,执行以下逻辑优化步骤:在所述原始星型模型中存在至少两组字段数据的字段使用频率的差值小于预设差值阈值的情况下,将所述至少两组字段数据整合至所述原始星型模型中的同一个视图中;获取所述原始星型模型中字段使用频率大于预设频率阈值的目标字段数据,并对所述原始星型模型中重复的多组所述目标字段数据进行合并处理。5.根据权利要求2所述的数据仓库的构建方法,其特征在于,所述基于所述视图数据量、所述视图结构复杂度、所述字段查询时长和所述字段使用频率,对所述原始星型模型进行存储优化,包括:以降低所述视图数据量、所述视图结构复杂度以及所述字段查询时长的数值为存储优化目标,以所述字段使用频率为存储优化参数,构建存储优化模型;2CN115858699A权利要求书2/2页基于所述存储优化模型对所述原始星型模型进行迭代优化,直至所述视图数据量、所述视图结构复杂度以及所述字段查询时长的每一个参数的当前数值均小于其对应的数值阈值。6.根据权利要求5所述的数据仓库的构建方法,其特征在于,所述字段数据包括单一字段数据和组合字段数据中的至少之一,所述单一字段数据