一种数据聚类的方法和装置.pdf
Ja****20
亲,该文档总共27页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
一种数据聚类的方法和装置.pdf
本发明实施例提供了一种数据聚类的方法和装置,其中,所述方法包括:获取待聚类的目标日志数据;判断是否查找到与所述目标日志数据相似的第一日志数据;在查找到所述第一日志数据时,根据所述第一日志数据确定第一聚类信息;按照所述第一聚类信息,对所述目标日志数据进行聚类。通过本发明实施例,实现了对日志数据聚类的优化,由于设置了根据第一次查找到相似的日志数据进行聚类,保证了聚类结果的一致性,能够兼容于存在并发的分布式系统,且无需计算与得到的多个聚类簇之间的相似度,还能够减少数据聚类所需计算的次数,降低了算法的复杂度,节省
一种用于文本数据聚类的方法和装置.pdf
本发明公开了一种用于文本数据聚类的方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:获取批量文本数据,以及确定所述批量文本数据中的每个文本数据的特征词集合;对于每个文本数据的特征词集合,确定该特征词集合中每个特征词的权重;根据所述特征词集合中特征词的权重,对所述批量文本数据进行排序;基于所述排序结果,对所述批量文本数据进行聚类计算。该方法利用特征权重对文本聚类的顺序重新排列,可优先将包含信息量丰富的文本数据聚类形成话题类,后续再根据该已聚成的话题类进行文本聚类,可提高聚类的准确性。
数据聚类方法以及装置.pdf
本说明书实施例提供数据聚类方法以及装置,其中所述数据聚类方法包括:获取待聚类数据集,并根据所述待聚类数据集中任意两个待聚类数据间的匹配概率,对所述任意两个待聚类数据进行聚类处理,生成中间聚类结果,根据所述中间聚类结果中任意两个待聚类数据间的匹配概率,确定所述中间聚类结果中、每个待聚类数据对应的期望值,其中,所述期望值包括聚类准确度期望值和/或聚类分裂度期望值,根据所述期望值,对所述中间聚类结果进行调整,生成对应的目标聚类结果。
一种用户聚类方法和装置.pdf
本申请提供了一种用户聚类方法和装置,该方法包括:确定待聚类的多个用户;分别获取每个该用户在动漫业务平台中的至少一个第一类兴趣标签,该第一类兴趣标签表征该用户在该动漫业务平台中访问过的动漫类型;分别获取每个该用户在指定的泛娱乐业务平台中的至少一个第二类兴趣标签,该第二类兴趣标签表征该用户在该泛娱乐业务平台中访问过的泛娱乐类型,该泛娱乐业务平台不同于该动漫业务平台;根据该用户具有的该至少一个第一类兴趣标签以及该至少一个第二类兴趣标签,对该多个用户进行聚类,得到聚类出的多个分类,每个该分类中包括至少一个该用户。
针对多方的隐私数据进行聚类的方法和装置.pdf
本说明书实施例提供一种针对多方的隐私数据进行聚类的方法和装置,方法包括:第一方确定K个类簇当前分别对应的各中心数据的第一数据部分,第一数据部分对应于第一维度集合;第二方具有各中心数据的对应于第二维度集合的第二数据部分;分别将各中心数据作为目标中心数据,基于N个样本中任一样本的第一特征部分和目标中心数据的第一数据部分,通过本地计算得到任一样本和目标中心数据的目标距离的第一分片;基于各目标距离的第一分片,利用秘密共享的方式,与第二方中的各目标距离的第二分片进行联合比较,确定各目标距离中的最近的目标距离;将最近