预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共19页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113988149A(43)申请公布日2022.01.28(21)申请号202110780627.3G06F16/35(2019.01)(22)申请日2021.07.09(71)申请人西安邮电大学地址710061陕西省西安市雁塔区长安南路563号(72)发明人夏虹陈彦萍王忠民高聪金小敏高慧董庆义(74)专利代理机构西安嘉思特知识产权代理事务所(普通合伙)61230代理人刘长春(51)Int.Cl.G06K9/62(2022.01)G06N3/00(2006.01)G06F16/951(2019.01)G06F40/216(2020.01)权利要求书4页说明书11页附图3页(54)发明名称一种基于粒子群模糊聚类的服务聚类方法(57)摘要本发明公开了一种基于粒子群模糊聚类的服务聚类方法,包括:获取多个服务对应的服务数据;对所述服务数据进行预处理,以得到目标服务数据,所述目标服务数据中包括关键词数据和关键词词频数据;确定所述服务数据对应的服务的簇个数;初始化粒子群;确定每个粒子的适应度值;更新每个粒子的速度和位置;判断更新后的每个粒子的位置是否满足全局位置最优值;根据判断结果,对服务进行聚类处理,其中,当粒子的位置满足全局位置最优值时,则基于模糊聚类算法,对所述服务进行聚类;当粒子的位置不满足全局位置最优值时,则重复步骤5至步骤8,直到服务聚类完成。本发明能够考虑服务与服务之间的相互关系,从而提高服务聚类准确度。CN113988149ACN113988149A权利要求书1/4页1.一种基于粒子群模糊聚类的服务聚类方法,其特征在于,包括:步骤1:获取多个服务对应的服务数据,其中,所述服务数据包括:服务描述文档、所述服务描述文档对应的种类和所述服务描述文档的个数;步骤2:对所述服务数据进行预处理,以得到目标服务数据,所述目标服务数据中包括关键词数据和关键词词频数据;步骤3:确定所述服务数据对应的服务的簇个数;步骤4:初始化粒子群;步骤5:确定每个粒子的适应度值;步骤6:更新每个粒子的速度和位置;步骤7:判断更新后的每个粒子的位置数值是否小于全局位置最优值;步骤8:根据判断结果,对服务进行聚类处理,其中,当粒子的位置数值小于全局位置最优值时,则基于模糊聚类算法,对所述服务进行聚类;当粒子的位置数值大于或等于全局位置最优值时,则重复步骤5至步骤8,直到服务聚类完成。2.根据权利要求1所述的方法,其特征在于,所述步骤1包括:步骤1‑1:通过预设爬取工具,从服务网站中爬取多个服务描述文档;步骤1‑2:按照预设统计计算规则,对所述服务描述文档进行统计计算,以得到每个所述服务描述文档对应的种类和所述服务描述文档的个数。3.根据权利要求1所述的方法,其特征在于,所述步骤2包括:步骤2‑1:基于预设关键词处理规则,处理所述服务数据,以对所述服务数据中的关键词进行提取;步骤2‑2:基于预设词频计算规则,计算所述服务数据中关键词的词频,表示为:其中,nij代表第j个单词在i个服务文档的数量,nij是第i个服务中所有单词的数量,nij代表文档的个数,IFij表示关键词词频,IDFi计算服务文档的重要程度,其中N代表服务文档的个数,ni代表在一个文档nij的个数。4.根据权利要求1所述的方法,其特征在于,所述步骤3包括:步骤3‑1:计算每个服务数据对应的服务的密度Dens(xi),表示为:其中,xi={xi1,xi2,…xim}表示服务,所述服务xi表示为一组具有m个分类属性为特征的集合,n表示服务的个数;步骤3‑2:确定每个服务对应的截断距离dc;步骤3‑3:对服务的密度的数值大小按照降序排序,表示为:2CN113988149A权利要求书2/4页rank=arg(sort(Dens(xi)),descent);步骤3‑4:根据所述截断距离,确定每个服务的相邻服务xi,表示为:Neib(xi);步骤3‑5:将每个服务对应的相邻服务分配给所述每个服务的簇中心,以形成多个簇团;步骤3‑6:将所述簇团个数确定为所述服务簇的个数。5.根据权利要求1所述的方法,其特征在于,所述步骤4包括:步骤4‑1:设置一个粒子群,所述粒子群中包括N个粒子p;步骤4‑2:随机产生控制变量C=(c1,c2,…,ck),其中,ci的值大于0小于1;步骤4‑3:确定粒子群中簇的个数,表示为:C(p)=k,其中,k=kmax;步骤4‑4:基于所述控制变量,对非核心区域的服务进行分类,以确定每个粒子中的有效服务簇数,表示为:t+1(t+1)h(p)=count(C(p)|cj>0.5|),j=1,...k,其中,当cj≥0.5时,则将非核心区域的服务归为服务簇中;或者,当cj<0.5时,不将非核心区域的服务归为服务簇中