预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共14页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN115392375A(43)申请公布日2022.11.25(21)申请号202211027451.5(22)申请日2022.08.25(71)申请人武汉东湖大数据交易中心股份有限公司地址430000湖北省武汉市东湖新技术开发区高新大道999号龙山创新园一期F3栋2101室(72)发明人孙想董婧婉王莉(74)专利代理机构武汉红观专利代理事务所(普通合伙)42247专利代理师赵征友(51)Int.Cl.G06K9/62(2022.01)权利要求书3页说明书8页附图2页(54)发明名称一种多源数据融合度智能评估方法及其系统(57)摘要本发明提供了一种多源数据融合度智能评估方法及其系统,包括如下步骤:S1:获取具体场景下的多源数据以及对应的目标客户任务信息;S2:建立具体场景下的多源数据与目标客户任务信息对应的映射关系模型,收集映射数据并作为映射数据集;S3:将映射数据集作为KNN分类器的输入,训练KNN分类器;S4:利用分类后的数据集建立回归模型,评估具体场景下的多源数据以及对应的目标客户任务信息融合程度。本发明所述的多源数据融合度智能评估方法及其系统可以对不同来源间数据的关系进行度量化,并得到目标用户的任务信息的融合评估指标,为多源数据融合应用提供了决策参考,减少了下一步数据融合认知计算和应用的盲目性。CN115392375ACN115392375A权利要求书1/3页1.一种多源数据融合度智能评估方法,其特征在于,包括如下步骤:S1:获取具体场景下的多源数据以及对应的目标客户任务信息;S2:建立具体场景下的多源数据与目标客户任务信息对应的映射关系模型,收集映射数据并作为映射数据集;S3:将映射数据集作为KNN分类器的输入,训练KNN分类器;S4:利用分类后的数据集建立回归模型,评估具体场景下的多源数据以及对应的目标客户任务信息融合程度。2.根据权利要求1所述的多源数据融合度智能评估方法,其特征在于,所述步骤S2具体包括如下步骤:将多源数据与目标客户任务信息进行归一化处理后并收集起来,建立映射数据集;将一组归一化处理后的多源数据X的取值范围映射到目标客户任务信息数据的区间[a,b]:其中,Xmax是这组数据X中的最大值,Xmin是这组数据X中的最小值,b为目标客户任务信息数据中的最大值,a为目标客户任务信息数据中的最小值,Y为映射后的数据。3.根据权利要求2所述的多源数据融合度智能评估方法,其特征在于,所述步骤S3具体包括如下步骤:(1)将映射数据集输入训练数据集T={(x1,y1),(x2,y2),...,(xN,yN)}其中:为n维的多源数据特征向量,其中,i=1,2,…,N;yi∈C={c1,c2,…,cK}为多源数据的类别,其中,i=1,2,…,N;(2)根据给定的距离量度方法,即使用欧氏距离在训练数据集T中找出与x最相近的k个样本点,并将这k个样本点所表示的集合记为Nk(x);(3)根据下述公式的多数投票原则确定多源数据X所属类别c:上式中I为指示函数:4.根据权利要求3所述的多源数据融合度智能评估方法,其特征在于,所述步骤S4具体包括如下步骤:根据分类后的数据集和逻辑回归分析法建立评估模型:根据每个特征数据在匹配关系数据库中的分布计算其对应的评估概率;2CN115392375A权利要求书2/3页根据所述每个特征数据的评估概率,确定其作为自变量在多元回归方程的权重,并建立多元回归方程;所述多元回归方程表示为:其中,P(y=1|x)表示概率的预测值,x表示特征数据,y表示评估概率;g(x)=w0+w1x1+...+wnxn,wd,d=0,…,n代表自变量xi,i=1,…,n在多元回归方程的权重,n代表特征数据的数量。5.一种多源数据融合度智能评估系统,其特征在于,所述系统包括:多源数据采集模块,用于获取具体场景下的多源数据以及对应的目标客户任务信息;多源数据映射模块,用于建立具体场景下的多源数据与目标客户任务信息对应的映射关系模型,收集映射数据并作为映射数据集;多源数据分类模块,用于将映射数据集作为KNN分类器的输入,训练KNN分类器;多源数据融合评估模块,用于利用分类后的数据集建立回归模型,评估具体场景下的多源数据以及对应的目标客户任务信息融合程度。6.根据权利要求5所述的多源数据融合度智能评估系统,其特征在于,所述多源数据映射模块具体用于:将多源数据与目标客户任务信息进行归一化处理后并收集起来,建立映射数据集;将一组归一化处理后的多源数据X的取值范围映射到目标客户任务信息数据的区间[a,b]:其中,Xmax是这组数据X中的最大值,Xmin是这组数据X中的最小值,b为目标客户任务信息数据中的最大值,a为目标客户任务信息数据中的最小值,Y为映射后的数据。7.根据