预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共16页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113760864A(43)申请公布日2021.12.07(21)申请号202110430181.1(22)申请日2021.04.21(71)申请人北京沃东天骏信息技术有限公司地址100176北京市经济技术开发区科创十一街18号院2号楼4层A402室申请人北京京东世纪贸易有限公司(72)发明人蒲海洋(74)专利代理机构北京同立钧成知识产权代理有限公司11205代理人张娜刘芳(51)Int.Cl.G06F16/21(2019.01)G06F16/242(2019.01)G06F16/28(2019.01)权利要求书2页说明书9页附图4页(54)发明名称数据模型的生成方法和装置(57)摘要本发明提供一种数据模型的生成方法和装置,从用户输入的第一SQL语句中提取目标指标和目标维度的特征字段,从全量特征库中确定目标指标的可替换指标,该全量特征库中存储有数据仓库中的SQL语句的指标和维度的特征字段,根据可替换指标和所述目标维度重组得到第二SQL语句,输出第二SQL语句。重组得到的第二SQL语句为第一SQL语句的可替换语句,能够满足用户的查询需求,该方法能够自动从已有SQL语句的特征字段提取本次加工所需要的维度和指标,利用已有的维度和指标重组SQL语句,完成数据模型的开发,提高了已有数据模型的利用率,避免重复开发造成的资源浪费。CN113760864ACN113760864A权利要求书1/2页1.一种数据模型的生成方法,其特征在于,包括:从用户输入的第一结构化查询语言SQL语句中提取目标指标和目标维度的特征字段;从全量特征库中确定所述目标指标的可替换指标,其中,所述全量特征库中存储有数据仓库中的SQL语句的指标和维度的特征字段,所述指标和维度的特征字段包括类型、全局唯一字段名称以及以下字段中的一个或者多个字段:字段名称、字段所在表、来源表路径、来源字段路径、过滤条件、计算逻辑;根据所述可替换指标和所述目标维度重组得到第二SQL语句,输出所述第二SQL语句,所述第二SQL语句为所述第一SQL语句的可替换语句。2.根据权利要求1所述的方法,其特征在于,所述从全量特征库中确定所述目标指标的可替换指标,包括:针对每个所述目标指标,获取所述目标指标的全局唯一名称字段;从所述全量特征库中查询与所述目标指标的全局唯一名称字段相同的所有指标组成第一候选指标集合;根据所述目标指标的来源表路径,从所述第一候选指标集合中确定与所述目标指标的来源表路径相同的指标,得到第二候选指标集合;根据所述目标指标的来源字段路径,从所述第二候选指标集合中确定与所述目标指标的来源字段路径相同的指标,得到第三候选指标集合;根据所述目标指标的计算逻辑,从所述第三候选指标集合中确定与所述目标指标的计算逻辑相同的指标,得到第四候选指标集合;根据所述目标指标的过滤条件,从所述第四候选指标集合中确定与所述目标指标的过滤条件相同的指标,得到所述目标指标的可替换指标。3.根据权利要求1或2所述的方法,其特征在于,所述第一SQL语句中包括多个目标指标,所述根据所述可替换指标和所述目标维度重组得到第二SQL语句,包括:当所述第一SQL语句中的多个目标指标的可替换指标的字段所在表均相同时,将所述第一SQL语句中的多个目标指标替换为可替换指标得到所述第二SQL语句。4.根据权利要求1或2所述的方法,其特征在于,所述第一SQL语句中包括多个目标指标,所述根据所述可替换指标和所述目标维度重组得到第二SQL语句,包括:当所述第一SQL语句中的多个目标指标的可替换指标的字段所在表均不相同时,分别以每个可替换指标为主字段,与所述第一SQL语句中的所有维度字段内连接得到单一指标的临时表,将每个临时表插入SQL语句中得到第三SQL语句;将得到的所有第三SQL语句进行内连接得到所述第二SQL语句。5.根据权利要求1或2所述的方法,其特征在于,所述第一SQL语句中包括多个目标指标,根据所述可替换指标和所述目标维度重组得到第二SQL语句,包括:当所述第一SQL语句中的第一目标指标具有可替换指标,且第二目标指标不具有可替换指标时,分别以每个可替换指标为主字段,与所述第一SQL语句中的所有维度字段内连接得到单一指标的临时表,将每个临时表插入SQL语句中得到第三SQL语句;将得到的所有第三SQL语句进行内连接得到第四SQL语句;将所述第四SQL语句与所述第二目标指标构造得到第五SQL语句进行内连接,得到所述第二SQL语句。2CN113760864A权利要求书2/2页6.根据权利要求1所述的方法,其特征在于,还包括:获取所述数据仓库中的所有数据模型的最新运行日志;抽取所述运行日志中的SQL语句,清洗所述SQL语句中的干扰字符;对清洗后的所述SQL语句进