预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共13页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN115952150A(43)申请公布日2023.04.11(21)申请号202211610209.0G06F16/2458(2019.01)(22)申请日2022.12.14(71)申请人北京市大数据中心地址101100北京市通州区潞城镇宏安街9号申请人太极计算机股份有限公司(72)发明人高嵩王睿宇章敏贾晓丰李宝东刘韶辉穆显显赵敏蔡姗姗(74)专利代理机构北京细软智谷知识产权代理有限责任公司11471专利代理师葛钟(51)Int.Cl.G06F16/21(2019.01)G06F16/22(2019.01)权利要求书2页说明书7页附图3页(54)发明名称一种多源异构的数据融合方法及装置(57)摘要本申请涉及一种多源异构的数据融合方法及装置,涉及数据处理技术领域,方法包括:获取待融合数据,对待融合数据中各字段赋予不同的权重算子,根据预先设定的数据关联规则和待融合数据中各字段的权重算子对待融合数据进行关联融合,得到待处理数据,最后对待处理数据进行标准化处理。本申请中综合考虑多种因素,对待融合数据中各字段赋予不同的权重算子,如对预期准确度高的字段赋予相对较高的权重算子,对预期准确度低的字段赋予相对较低的权重算子,在进行关联融合时使融合数据对数据的紧密依赖程度更高,从而得到的融合数据更加准确、可靠。CN115952150ACN115952150A权利要求书1/2页1.一种多源异构的数据融合方法,其特征在于,包括:获取待融合数据;对所述待融合数据中各字段赋予不同的权重算子;根据预先设定的数据关联规则和待融合数据中各字段的权重算子对所述待融合数据进行关联融合,得到待处理数据;对所述待处理数据进行标准化处理。2.根据权利要求1所述的方法,其特征在于,所述获取待融合数据,包括:从多个数据来源获取所述待融合数据。3.根据权利要求2所述的方法,其特征在于,所述对所述待融合数据中各字段赋予不同的权重算子,包括:将所述待融合数据划分为多类字段,各类字段下包括多个子字段;确定各数据来源的级别,并确定各子字段的业务归属;根据各数据来源的级别和各子字段的业务归属确定每类字段下各子字段的权重算子。4.根据权利要求1‑3任一项所述的方法,其特征在于,所述方法还包括:确定各子字段的主观因素影响值,根据各子字段的主观因素影响值对各子字段的权重算子进行校准。5.根据权利要求4所述的方法,其特征在于,所述根据预先设定的数据关联规则和待融合数据中各字段的权重算子对所述待融合数据进行关联融合,包括:根据所述待融合数据中各子字段的权重算子计算所述待融合数据中各子字段相对于所属字段类别的准确度值;根据各子字段相对于所属字段类别的准确度值,得到各类字段的融合后统一数据值作为融合后数据。6.根据权利要求5所述的方法,其特征在于,所述根据预先设定的数据关联规则和待融合数据中各字段的权重算子对所述待融合数据进行关联融合,包括:确定所述融合后数据中的唯一关联标识;对所述融合后数据中,与所述唯一关联标识具有关联性的数据按照相同数据结构之间进行关联;所述数据结构至少包括:库表和数据项;建立数据关联模型,所述数据关联模型用于构建数据结构之间的关联关系;获取所述待融合数据的具体数值信息,根据所述待融合数据的具体数值信息对所述数据关联模型进行验证;在验证通过时,将关联后的数据作为所述待处理数据。7.根据权利要求5所述的方法,其特征在于,所述方法还包括:在验证通过时,将所述数据关联模型进行发布。8.根据权利要求1所述的方法,其特征在于,所述方法还包括:对所述待处理数据进行清洗去重处理。9.根据权利要求1所述的方法,其特征在于,所述对所述待处理数据进行标准化处理,包括:对所述待处理数据中各类字段的融合后数据通过对应的数据转换方式转换为对应编码值。2CN115952150A权利要求书2/2页10.一种多源异构的数据融合装置,其特征在于,包括:获取模块,用于获取待融合数据;赋权模块,用于对所述待融合数据中各字段赋予不同的权重算子;关联融合模块,用于根据预先设定的数据关联规则和待融合数据中各字段的权重算子对所述待融合数据进行关联融合,得到待处理数据;处理模块,用于对所述待处理数据进行标准化处理。3CN115952150A说明书1/7页一种多源异构的数据融合方法及装置技术领域[0001]本申请涉及数据处理技术领域,尤其涉及一种多源异构的数据融合方法及装置。背景技术[0002]在信息化建设过程中,由于各业务系统建设和实施数据管理系统的阶段性、技术性以及其它经济和人为因素等因素影响,导致在发展过程中积累了大量采用不同存储方式的业务数据,数据管理系统也包括简单的文件数据库和复杂的网络数据库,因此存在着大量多源的异构数据。[0003]多源异构数据存在着