预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共30页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113971426A(43)申请公布日2022.01.25(21)申请号202010714048.4(22)申请日2020.07.22(71)申请人中移(苏州)软件技术有限公司地址215163江苏省苏州市高新区昆仑山路58号1幢申请人中国移动通信集团有限公司(72)发明人洪华剑(74)专利代理机构北京派特恩知识产权代理有限公司11270代理人刘鹤张颖玲(51)Int.Cl.G06K9/62(2022.01)G16H50/70(2018.01)权利要求书3页说明书17页附图9页(54)发明名称一种信息获取方法、装置、设备及存储介质(57)摘要本申请实施例公开了一种信息获取方法,该方法包括:获取目标样本数据,并对所述目标样本数据进行聚类处理,得到第一类簇集合;其中,所述目标样本数据包括至少一个样本数据,所述第一类簇集合包括至少一个类簇;对所述第一类簇集合的类簇的样本数据进行聚类处理,得到第二类簇集合;基于所述第二类簇集合,确定目标检测模型;基于所述目标检测模型,对待检测数据进行预测处理,得到预测结果,从而实现了精确区分出大类簇中的小类簇,避免了密度峰值算法在应用过程中出现误判的可能性,保证了密度峰值算法在应用过程中判断的准确性。本申请实施例还公开了一种信息获取装置、设备和存储介质。CN113971426ACN113971426A权利要求书1/3页1.一种信息获取方法,其特征在于,所述方法包括:获取目标样本数据,并对所述目标样本数据进行聚类处理,得到第一类簇集合;其中,所述目标样本数据包括至少一个样本数据,所述第一类簇集合包括至少一个类簇;对所述第一类簇集合的类簇的样本数据进行聚类处理,得到第二类簇集合;基于所述第二类簇集合,确定目标检测模型;基于所述目标检测模型,对待检测数据进行预测处理,得到预测结果。2.根据权利要求1所述的方法,其特征在于,所述对所述第一类簇集合的类簇的样本数据进行聚类处理,得到第二类簇集合,包括:对所述第一类簇集合中的类簇进行分类处理,得到第一目标类簇集合和第二目标类簇集合;其中,所述第二目标类簇集合中每一类簇的样本数量均大于或等于所述第一目标类簇集合中每一类簇的样本数量;对所述第二目标类簇集合中的每一类簇的样本数据进行聚类处理,得到第三目标类簇集合;其中,所述第二类簇集合包括所述第一目标类簇集合和所述第三目标类簇集合。3.根据权利要求2所述的方法,其特征在于,所述对所述第一类簇集合中的类簇进行分类处理,得到第一目标类簇集合和第二目标类簇集合,包括:统计所述第一类簇集合中每一类簇的样本数量,得到第一数量集合;对所述第一数量集合中的样本数量按照从小到大的顺序进行排序,得到目标数量序列;基于所述目标数量序列,对所述第一类簇集合中的类簇进行分类处理,得到所述第一目标类簇集合和所述第二目标类簇集合。4.根据权利要求3所述的方法,其特征在于,所述基于所述目标数量序列,对所述第一类簇集合中的类簇进行分类处理,得到所述第一目标类簇集合和所述第二目标类簇集合,包括:计算所述目标数量序列中第1至第r个样本数量的和值,与所述目标数量序列中第r+1至第m个样本数量的和值的比值,得到包括m-1个比值的比值集合;其中,m为大于1的整数,r=1,2,……,m-1,m为所述第一数量集合中的元素个数;获取第一阈值;从所述比值集合中确定比值小于或等于所述第一阈值的目标比值,并确定目标比值中最大比值对应的排序位置L,从所述第一类簇集合中获取所述第1至第L个样本数量对应的类簇,得到所述第一目标类簇集合;从所述第L+1至第m个样本数量对应的类簇中,获取所述第二目标类簇集合。5.根据权利要求4所述的方法,其特征在于,所述从所述第L+1至第m个样本数量对应的类簇,获取所述第二目标类簇集合,包括:计算所述第L+1至第m个样本数量对应的类簇中每一类簇的误差平方和;从所述第L+1至第m个样本数量对应的类簇中,获取误差平方和大于或等于第二阈值的类簇,从而得到所述第二目标类簇集合。6.根据权利要求2所述的方法,其特征在于,所述对所述第二目标类簇集合中的每一类簇的样本数据进行聚类处理,得到第三目标类簇集合,包括:获取所述目标样本数据对应的决策图,获取所述第二目标类簇集合中第j类簇对应的k2CN113971426A权利要求书2/3页个第一聚类中心;其中,j为正整数,k为正整数;基于所述k个第一聚类中心对所述第j类簇的样本数据进行聚类处理,得到k个第一子类簇;计算每一第一子类簇的样本数据的平均值,得到k个第二聚类中心;若所述第j类簇中的样本数据未分配完成,且所述k个第二聚类中心与所述第一聚类中心相同,或所述k个第一子类簇误差平方和的平均值小于第三阈值,得到所述第三目标类簇集合;其中,所述第三