一种应用于数据仓库的聚类方法、装置、设备和存储介质.pdf
是你****平呀
亲,该文档总共25页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
一种应用于数据仓库的聚类方法、装置、设备和存储介质.pdf
本发明实施例公开了一种应用于数据仓库的聚类方法、装置、设备和存储介质。获取数据仓库中的各字段,确定各字段在向量空间的局部密度,根据局部密度确定各字段中作为簇中心点的字段,按照局部密度将簇中心点进行分箱处理,并将簇中心点之外的其他字段加入距离最近的簇中心点对应的簇中,可以得到局部密度均匀且每类簇中的数据量大小统一的分箱,进一步根据局部密度对每一分箱内的字段进行聚类,适用于任意聚类形状的字段,并对每个分箱内的相同字段完成聚类。解决了现有技术中因聚类大小不一、聚类形状非凸以及聚类密度不均降低聚类结果的准确性的问
人像聚类方法、装置、电子设备和存储介质.pdf
一种人像聚类方法、装置、电子设备和存储介质,用于提高人像聚类的召回率。本申请中,获取第一卡口在第一时间段内采集的第一人像信息,获取第二卡口在第一时间段内采集的第二人像信息。根据第一卡口和第二卡口的相关性程度,以及第一人像信息和第二人像信息的相似度比对结果,确定第一人像信息和第二人像信息的目标相似度。根据目标相似度,对第一人像信息和第二人像信息进行聚类。由于结合了卡口的相关性进行聚类,因此可以提高人像聚类的召回率。
一种网站聚类方法、装置、设备及存储介质.pdf
本申请公开了一种网站聚类方法、装置、设备及存储介质。该方法包括:获取待聚类网页包含的所有属性值;利用自然语言处理的词嵌入技术,按照目标维度将每个所述属性值转换为低维稠密向量;基于所述低维稠密向量得到每个待聚类网站对应的网页向量;计算不同待聚类网页的网页向量之间的相似度,并根据所述相似度对所述待聚类网页进行聚类以得到不同类型的网页簇。基于所有属性值的相似度比较提高了聚类的准确性,并结合自然语言处理和聚类算法来寻找同类网站,可实现批量准确寻找相似网站,将相同模板网站进行快速归类,为侦查人员寻找已知黑灰产网站的
聚类方法、装置、电子设备及存储介质.pdf
本申请提出了一种聚类方法及装置,其中,适用于业务节点的方法包括针对每个类簇,基于属于所述类簇的目标第一样本的编号,生成所述类簇的簇向量,并对所述簇向量加密后发给参与节点,其中,所述簇向量用于表征所述类簇的簇心;获取每个类簇对应的所述业务节点的第一样本到簇心的第一差矩阵,以及对应的所述参与节点的第二样本到所述簇心的第二差矩阵;根据每个类簇的所述第一差矩阵和所述第二差矩阵更新簇心,以所述更新的簇心对所述第一样本进行重分簇,并以重分簇后得到的每个类簇作为下一次迭代对应的类簇,返回执行上述步骤直至迭代结束,生成最
聚类网络训练和目标聚类方法、装置、终端及存储介质.pdf
本发明提供一种聚类网络训练和目标聚类方法、装置、终端及存储介质,聚类网络训练方法包括获取训练样本集,其中训练样本集包括包含目标对象的多个样本图像;基于聚类网络对各样本图像关联的第一K近邻图进行处理,得到第一K近邻图中的主节点和各近邻节点之间对应的连接边的类型预测结果;将连接边的类型预测结果以及连接边所连接的主节点和/或近邻节点的聚类难度系数代入损失函数,得到损失值,损失值的绝对值与所代入的聚类难度系数正相关;基于损失值对聚类网络进行迭代训练。本申请使聚类网络更重视聚类难度系数更大的样本图像的预测准确率,进