预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共29页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN115019078A(43)申请公布日2022.09.06(21)申请号202210946778.6(22)申请日2022.08.09(71)申请人阿里巴巴(中国)有限公司地址311121浙江省杭州市余杭区五常街道文一西路969号3幢5层554室(72)发明人刘俊龙申晨沈旭黄建强(74)专利代理机构北京智信禾专利代理有限公司11637专利代理师赵杰(51)Int.Cl.G06V10/762(2022.01)G06V10/75(2022.01)G06V10/74(2022.01)权利要求书3页说明书18页附图7页(54)发明名称数据聚类方法以及装置(57)摘要本说明书实施例提供数据聚类方法以及装置,其中所述数据聚类方法包括:获取待聚类数据集,并根据所述待聚类数据集中任意两个待聚类数据间的匹配概率,对所述任意两个待聚类数据进行聚类处理,生成中间聚类结果,根据所述中间聚类结果中任意两个待聚类数据间的匹配概率,确定所述中间聚类结果中、每个待聚类数据对应的期望值,其中,所述期望值包括聚类准确度期望值和/或聚类分裂度期望值,根据所述期望值,对所述中间聚类结果进行调整,生成对应的目标聚类结果。CN115019078ACN115019078A权利要求书1/3页1.一种数据聚类方法,包括:获取与目标项目相关的视频流,对所述视频流进行解析获得待聚类数据集,并根据所述待聚类数据集中任意两个待聚类数据间的匹配概率,对所述任意两个待聚类数据进行聚类处理,生成中间聚类结果;根据所述中间聚类结果中任意两个待聚类数据间的匹配概率,确定所述中间聚类结果中、每个待聚类数据对应的期望值,其中,所述期望值包括聚类准确度期望值和/或聚类分裂度期望值;根据所述期望值,对所述中间聚类结果进行调整,生成对应的目标聚类结果。2.根据权利要求1所述的数据聚类方法,所述根据所述待聚类数据集中任意两个待聚类数据间的匹配概率,对所述任意两个待聚类数据进行聚类处理,包括:对所述待聚类数据集中包含的至少两个待聚类数据进行特征提取处理,生成对应的特征提取结果;基于所述特征提取结果确定所述至少两个待聚类数据中、任意两个待聚类数据间的匹配概率;根据所述匹配概率,对所述至少两个待聚类数据进行聚类处理。3.根据权利要求2所述的数据聚类方法,所述基于所述特征提取结果确定所述至少两个待聚类数据中、任意两个待聚类数据间的匹配概率,包括:基于所述特征提取结果确定所述至少两个待聚类数据中、任意两个待聚类数据间的目标欧式距离;根据预设的欧式距离与匹配概率间的映射关系,确定与所述目标欧式距离存在映射关系的目标匹配概率,并将所述目标匹配概率确定为所述至少两个待聚类数据中、任意两个待聚类数据间的匹配概率。4.根据权利要求1任意一项所述的数据聚类方法,所述根据所述待聚类数据集中任意两个待聚类数据间的匹配概率,对所述任意两个待聚类数据进行聚类处理,生成中间聚类结果,包括:根据所述待聚类数据集中任意两个历史待聚类数据间的第一匹配概率,对所述任意两个历史待聚类数据进行聚类处理,生成初始聚类结果;确定待聚类数据集中、目标待聚类数据与每个历史待聚类数据间的第二匹配概率;根据所述第二匹配概率,对所述初始聚类结果进行更新,生成中间聚类结果。5.根据权利要求4所述的数据聚类方法,所述根据所述第二匹配概率,对所述初始聚类结果进行更新,包括:根据所述第二匹配概率确定所述目标待聚类数据对应的第一类别;根据所述第一类别及所述初始聚类结果对应的第二类别,对所述初始聚类结果进行更新。6.根据权利要求5所述的数据聚类方法,所述根据所述第一类别及所述初始聚类结果对应的第二类别,对所述初始聚类结果进行更新,包括:在所述第一类别与第一初始聚类结果对应的第二类别一致的情况下,将所述目标待聚类数据添加至所述第一初始聚类结果,其中,所述第一初始聚类结果为所述初始聚类结果之一;2CN115019078A权利要求书2/3页确定所述第一初始聚类结果的第一类代表对象,并确定所述第一类代表对象与第一历史待聚类数据间的第三匹配概率,其中,所述第一历史待聚类数据属于第二初始聚类结果,所述第二初始聚类结果为所述初始聚类结果之一;根据所述第三匹配概率对所述初始聚类结果进行更新。7.根据权利要求5或6所述的数据聚类方法,所述根据所述第一类别及所述初始聚类结果对应的第二类别,对所述初始聚类结果进行更新,包括:在所述第一类别与所述第二类别不一致的情况下,对所述目标待聚类数据及第一初始聚类结果中的第二历史待聚类数据进行聚类,生成第三初始聚类结果,其中,目标待聚类数据与所述第二历史待聚类数据间的第二匹配概率大于预设概率阈值;确定所述第三初始聚类结果的第三类代表对象,并确定所述第三类代表对象与所述第一初始聚类结果和/或第二初