预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共43页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN114118180A(43)申请公布日2022.03.01(21)申请号202110360295.3(22)申请日2021.04.02(71)申请人京东科技控股股份有限公司地址100176北京市北京经济技术开发区科创十一街18号C座2层221室(72)发明人韩雨锦李怡欣陈晓霖王虎黄志翔彭南博(74)专利代理机构北京清亦华知识产权代理事务所(普通合伙)11201代理人韩海花(51)Int.Cl.G06K9/62(2006.01)G06F21/60(2013.01)权利要求书5页说明书26页附图11页(54)发明名称聚类方法、装置、电子设备及存储介质(57)摘要本申请提出了一种聚类方法及装置,其中,适用于业务节点的方法包括针对每个类簇,基于属于所述类簇的目标第一样本的编号,生成所述类簇的簇向量,并对所述簇向量加密后发给参与节点,其中,所述簇向量用于表征所述类簇的簇心;获取每个类簇对应的所述业务节点的第一样本到簇心的第一差矩阵,以及对应的所述参与节点的第二样本到所述簇心的第二差矩阵;根据每个类簇的所述第一差矩阵和所述第二差矩阵更新簇心,以所述更新的簇心对所述第一样本进行重分簇,并以重分簇后得到的每个类簇作为下一次迭代对应的类簇,返回执行上述步骤直至迭代结束,生成最终的目标类簇。本申请中,通过对交互的数据的加密,有效保证了数据安全及保密性。CN114118180ACN114118180A权利要求书1/5页1.一种聚类方法,其特征在于,适用于业务节点,所述方法包括:针对每个类簇,基于属于所述类簇的目标第一样本的编号,生成所述类簇的簇向量,并对所述簇向量加密后发给参与节点,其中,所述簇向量用于表征所述类簇的簇心;获取每个类簇对应的所述业务节点的第一样本到簇心的第一差矩阵,以及对应的所述参与节点的第二样本到所述簇心的第二差矩阵;根据每个类簇的所述第一差矩阵和所述第二差矩阵更新簇心,以所述更新的簇心对所述第一样本进行重分簇,并以重分簇后得到的每个类簇作为下一次迭代对应的类簇,返回执行上述步骤直至迭代结束,生成最终的目标类簇。2.根据权利要求1所述的方法,其特征在于,所述第一差矩阵的获取过程包括:按照样本数量对当次迭代的簇向量进行列方向重复,构建当次迭代的簇矩阵;获取所述簇矩阵与所述业务节点的特征空间矩阵相乘,得到相乘矩阵,并将所述特征空间矩阵与所述相乘矩阵相减,生成所述当次迭代对应的所述第一差矩阵。3.根据权利要求1或2所述的方法,其特征在于,针对初次迭代,所述第二差矩阵的获取过程包括:接收所述参与节点发送所述初次迭代对应的加密第二差矩阵,对所述加密第二差矩阵进行解密,得到所述第二差矩阵,其中,所述加密第二差矩阵由所述参与节点基于自身的加密特征空间矩阵和加密的初始簇向量确定。4.根据权利要求1或2所述的方法,其特征在于,针对非初次迭代,所述第二差矩阵的获取过程包括:接收所述参与节点发送的当次迭代对应的加密更新差矩阵,其中,所述加密更新差矩阵用于表征上次迭代出的簇心与当次迭代出的簇心之间的距离,并由所述参与节点基于自身的特征空间矩阵、上次迭代的所述加密的簇向量和当次迭代的所述加密的簇向量生成;对所述加密更新差矩阵进行解密,得到更新差矩阵;基于上次迭代对应的所述第二差矩阵与当次迭代的所述更新差矩阵相加,得到当次迭代的所述第二差矩阵。5.根据权利要求1所述的方法,其特征在于,还包括:初次迭代时随机设定数量的第一样本,并将所述设定数量的第一样本中的每个第一样本作为一个初始簇心,其中,一个所述初始簇心对应的一个初始类簇;将所述作为所述初始簇心的第一样本确定为所述初始类簇的所述目标第一样本;以所述初始类簇的所述目标第一样本的编号,生成所述初始类簇的簇向量。6.根据权利要求1或5所述的方法,其特征在于,所述簇向量的生成过程,包括:根据所述编号确定所述目标第一样本在所述簇向量中的位置,并将所述位置上的向量元素编码为第一编码值;将剩余位置上的向量元素均编码为第二编码值,其中所述剩余位置上的向量元素对应未属于所述类簇的第一样本。7.根据权利要求6所述的方法,其特征在于,所述将所述位置上的向量元素编码为第一编码值,包括:针对任一类簇,获取属于所述任一类簇的所述目标第一样本的数量,根据所述目标第一样本的数量,确定所述第一编码值。2CN114118180A权利要求书2/5页8.根据权利要求1所述的方法,其特征在于,还包括:接收所述参与节点发送的加密验证向量,并基于所述私钥对所述加密验证向量进行解密,得到解密验证向量,其中,所述加密验证向量根据所述加密的簇向量生成;向所述参与节点发送所述解密验证向量以对所述进行安全验证。9.根据权利要求1所述的方法,其特征在于,还包括:基于样本的标识信息,与所