预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共16页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN112529115A(43)申请公布日2021.03.19(21)申请号202110159392.6(22)申请日2021.02.05(71)申请人支付宝(杭州)信息技术有限公司地址310000浙江省杭州市西湖区西溪路556号8层B段801-11(72)发明人李龙飞周俊(74)专利代理机构成都七星天知识产权代理有限公司51253代理人袁春晓(51)Int.Cl.G06K9/62(2006.01)G06N3/04(2006.01)G06N3/08(2006.01)权利要求书3页说明书9页附图3页(54)发明名称一种对象聚类方法和系统(57)摘要本说明书涉及一种对象聚类方法和系统,在该方法包括基于多个对象及对象间的关联关系构造图数据;其中,所述图数据包括多个节点以及节点间的边权信息;对图神经网络模型进行一轮或多轮迭代更新,并将最后一轮迭代更新获得的图数据的节点类簇作为节点聚类结果,进而基于节点聚类结果确定对象聚类结果,其中一轮迭代更新包括:利用图神经网络模型处理图数据,得到各节点的嵌入向量,以及基于各节点的嵌入向量确定的节点间的边权预测信息;利用聚类算法处理各节点的嵌入向量,得到一个或多个类簇;确定每个类簇的中心点的嵌入向量,并计算各节点与其所在类簇的中心点的距离;调整所述图神经网络模型的模型参数。CN112529115ACN112529115A权利要求书1/3页1.一种对象聚类方法,所述方法包括:基于多个对象及对象间的关联关系构造图数据;其中,所述图数据包括多个节点以及节点间的边权信息,所述节点与对象对应,所述节点间的边权信息反映对应对象间的关联关系;对图神经网络模型进行一轮或多轮迭代更新,并将最后一轮迭代更新获得的图数据的节点类簇作为节点聚类结果,进而基于节点聚类结果确定对象聚类结果,其中一轮迭代更新包括:利用图神经网络模型处理图数据,得到各节点的嵌入向量,以及基于各节点的嵌入向量确定的节点间的边权预测信息;利用聚类算法处理各节点的嵌入向量,得到一个或多个类簇;确定每个类簇的中心点的嵌入向量,并基于各节点及各中心点的嵌入向量,计算各节点与其所在类簇的中心点的距离;调整所述图神经网络模型的模型参数,以减小所述节点间的边权预测信息与所述节点间的边权信息的差异,以及减小各节点与其所在类簇的中心点的距离。2.如权利要求1所述的方法,所述基于各节点的嵌入向量确定的节点间的边权预测信息,包括对各节点中的任意两个节点:计算该两个节点的嵌入向量的内积,将内积结果作为该两个节点的边权预测信息。3.如权利要求1所述的方法,所述确定每个类簇的中心点的嵌入向量,包括:计算类簇中各节点的嵌入向量的均值;基于所述均值确定该类簇的中心点的嵌入向量。4.如权利要求1所述的方法,各个类簇的中心点的嵌入向量通过所述聚类算法得到。5.如权利要求1所述的方法,所述调整所述图神经网络模型的模型参数,以减小所述节点间的边权预测信息与所述节点间的边权信息的差异,以及减小各节点与其所在类簇的中心点的距离,包括:构造第一损失函数,所述第一损失函数与节点间的边权预测信息和节点间的边权信息的差异正相关;构造第二损失函数,所述第二损失函数与各节点与其所在类簇的中心点的距离之和正相关;构造联合损失函数,所述联合损失函数与第一损失函数、第二损失函数均正相关;调整所述图神经网络模型的模型参数,以减小联合损失函数。6.如权利要求5所述的方法,所述构造联合损失函数,包括:将第一损失函数与第二损失函数按预设比例求和,得到所述联合损失函数;其中,预设比例可调。7.如权利要求1所述的方法,所述图神经网络模型包括GCN或GraphSage;所述聚类算法包括K‑Means聚类算法、均值偏移聚类算法、DBSCAN聚类算法、高斯混合聚类算法或层次聚类算法;所述距离包括余弦距离或欧氏距离。8.一种对象聚类系统,包括:构造模块,用于基于多个对象及对象间的关联关系构造图数据;其中,所述图数据包括多个节点以及节点间的边权信息,所述节点与对象对应,所述节点间的边权信息反映对应对象间的关联关系;2CN112529115A权利要求书2/3页迭代模块,用于对图神经网络模型进行一轮或多轮迭代更新,并将最后一轮迭代更新获得的图数据的节点类簇作为节点聚类结果,进而基于节点聚类结果确定对象聚类结果,其中一轮迭代更新包括:利用图神经网络模型处理图数据,得到各节点的嵌入向量,以及基于各节点的嵌入向量确定的节点间的边权预测信息;利用聚类算法处理各节点的嵌入向量,得到一个或多个类簇;确定每个类簇的中心点的嵌入向量,并基于各节点及各中心点的嵌入向量,计算各节点与其所在类簇的中心点的距离;调整所述图神经网络模型的模型参数,以减小所述节点间的边权预测信息与所述节点间