预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共24页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN116010216A(43)申请公布日2023.04.25(21)申请号202310150403.3(22)申请日2023.02.21(71)申请人阿维塔科技(重庆)有限公司地址401121重庆市渝北区金开大道西段106号1幢1层24号(72)发明人赵洪涛(74)专利代理机构北京派特恩知识产权代理有限公司11270专利代理师李丽霞徐川(51)Int.Cl.G06F11/30(2006.01)G06F11/34(2006.01)权利要求书2页说明书16页附图5页(54)发明名称数据资产健康度的评估方法、装置、设备及存储介质(57)摘要本申请提供一种数据资产健康度的评估方法、装置、设备及计算机可读存储介质,所述方法包括:获取待评估数据资产和预先构建的评估模型,所述待评估数据资产包括来自多个数据平台的存储在数据湖的多个数据表中的多条数据;根据所述待评估数据资产,确定评估指标;利用所述评估模型对所述评估指标进行处理,得到评估结果,所述评估结果表征所述待评估数据资产的健康度,如此实现对数据资产的健康程度进行准确、客观地量化评估,通过该方法衡量数据湖存储的数据是否健康合理,有助于解决数据湖存在的数据质量差、数据成本高、数据使用难度大及单位数据价值低等问题。CN116010216ACN116010216A权利要求书1/2页1.一种数据资产健康度的评估方法,其特征在于,所述方法包括:获取待评估数据资产和预先构建的评估模型,所述待评估数据资产包括来自多个数据平台的存储在数据湖的多个数据表中的多条数据;根据所述待评估数据资产,确定评估指标;利用所述评估模型对所述评估指标进行处理,得到评估结果,所述评估结果表征所述待评估数据资产的健康度。2.根据权利要求1所述的方法,其特征在于,所述评估指标包括数据相似指标、数据模型指标、数据存储指标、数据计算指标和数据服务指标中的至少一个;所述评估模型包括与所述数据相似指标对应的数据设计评估子模型、与所述数据模型指标对应的数据处理评估子模型、与所述数据存储指标和所述数据计算指标对应的数据存储计算评估子模型、与所述数据服务指标对应的数据服务评估子模型和用于进行融合处理的融合子模型。3.根据权利要求2所述的方法,其特征在于,根据所述待评估数据资产,确定数据相似指标,包括:根据所述待评估数据资产,获取每一数据表包括的字段和所述字段的描述信息;根据各字段和所述各字段的描述信息,确定每一字段与其他字段两两之间的相似度;将每一字段与其他字段两两之间的相似度,确定为数据相似指标。4.根据权利要求2所述的方法,其特征在于,根据所述待评估数据资产,确定数据模型指标,包括:获取所述待评估数据资产的应用日志记录;根据所述待评估数据资产,获取每一数据表对应的数据模型和所述数据模型的核心子模型;根据所述应用日志记录,获取各数据表对应的数据模型的复用次数;根据所述应用日志记录,获取各数据表对应的数据模型的核心子模型在预设时长内的变更次数;按照预设划分指令,对各数据表对应的数据模型进行层级划分,确定各数据表对应的数据模型的依赖正确性;将所述复用次数、变更次数和依赖正确性,确定为数据模型指标。5.根据权利要求2所述的方法,其特征在于,根据所述待评估数据资产,确定数据存储指标和数据计算指标,包括:获取所述待评估数据资产的存储压缩率和存储解压速度;获取所述待评估数据资产的计算资源利用率和计算资源浪费率;将所述存储压缩率和存储解压速度确定为数据存储指标,将所述计算资源利用率和计算资源浪费率确定为数据计算指标。6.根据权利要求2所述的方法,其特征在于,根据所述待评估数据资产,确定数据服务指标,包括:获取所述待评估数据资产的服务日志记录;根据所述服务日志记录,获取所述待评估数据资产的调用次数、调用成功率、查询次数、查询速度和服务个数;2CN116010216A权利要求书2/2页将所述调用次数、调用成功率、查询次数、查询速度和服务个数,确定为数据服务指标。7.根据权利要求2所述的方法,其特征在于,所述利用所述评估模型对所述评估指标进行处理,得到评估结果,包括:利用所述数据设计评估子模型对所述数据相似指标进行处理,得到数据接入评估子结果;利用所述数据处理评估子模型对所述数据模型指标进行处理,得到数据模型评估子结果;利用所述数据存储计算评估子模型对所述数据存储指标和数据计算指标进行处理,得到数据存储计算评估子结果;利用所述数据服务评估子模型对所述数据服务指标进行处理,得到数据服务评估子结果;利用所述融合子模型对所述数据接入评估子结果、数据模型评估子结果、数据存储计算评估子结果和数据服务评估子结果进行融合处理,得到评估结果。8.一种数据资产健康度的评估装置,其特征在于,所述装置包括:获取模块,用于获