预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共22页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN115935266A(43)申请公布日2023.04.07(21)申请号202211063633.8(22)申请日2022.09.01(30)优先权数据17/491,4942021.09.30US(71)申请人国际商业机器公司地址美国纽约阿芒克(72)发明人藩进勇阮明林J.R.卡拉格纳南C.K.雷迪S.杰亚拉曼(74)专利代理机构北京市柳沈律师事务所11105专利代理师陈金林(51)Int.Cl.G06F18/2411(2023.01)G06F18/2413(2023.01)G06N20/00(2019.01)权利要求书2页说明书11页附图8页(54)发明名称用于分类的多-多面体机器(57)摘要一种生成用于机器学习的分类器引擎的计算机实现的方法,包括接收数据点集。将半监督k‑均值过程应用于来自每个类的数据点集。使用半监督k‑均值过程将类中的数据点集集群成多个数据点集群。针对来自所有类的集群中的一个或多个构建多‑多面体。在来自所有类的每对集群上运行支持向量机(SVM)过程。针对被集群的类确定分离超平面。基于通过超平面的分离为每个集群确定标记。CN115935266ACN115935266A权利要求书1/2页1.一种生成用于机器学习的分类器引擎的计算机实现的方法,包括:接收数据点集;将半监督k‑均值过程应用于来自每个类的所述数据点集;使用所述半监督k‑均值过程将所述数据点集集群成针对每个类的多个数据点集群;针对被集群的类中的一个或多个构建多‑多面体;在来自所有类的每对集群上运行支持向量机SVM过程;针对被集群的类确定分离超平面;以及基于所述分离超平面确定每个集群的标记。2.根据权利要求1所述的方法,还包括与数据点的负性类分离地对数据点的正性类进行集群。3.根据权利要求1所述的方法,还包括识别来自被集群的类中的一个的信息,并且在确定所述被集群的类中的另一个时使用所识别的信息作为约束。4.根据权利要求1所述的方法,还包括:确定来自所有类的数据点的集群中的误分类测量;以及基于所述误分类测量来训练用于改进的集群的所述半监督k‑均值过程。5.根据权利要求1所述的方法,其中所述分离超平面是来自所有类的一对集群之间的非线性边界。6.根据权利要求1所述的方法,其中所述半监督k‑均值过程是正则化的。7.根据权利要求1所述的方法,还包括确定数据点的每类的多个多面体。8.根据权利要求1所述的方法,还包括确定数据点的每类的多个分离超平面。9.一种生成用于机器学习的分类器引擎的软件即服务SaaS计算机实现的方法,包括:通过网络连接从远程用户接收数据点集和对分类服务的请求;由本地计算机服务器向来自每个类的所述数据点集应用半监督k‑均值过程;使用所述半监督k‑均值过程将所述数据点集集群成针对每个类的多个数据点集群;针对被集群的类中的一个或多个构建多‑多面体;在来自所有类的每对集群上运行支持向量机SVM过程;针对被集群的类确定分离超平面;基于所述分离超平面确定每个集群的标记;以及将每个集群的所确定的标记提供给所述远程用户。10.根据权利要求9所述的SaaS计算机实现的方法,还包括与数据点的负性类分离地对数据点的正性类进行集群。11.根据权利要求9所述的SaaS计算机实现的方法,还包括识别来自被集群的类中的一个的信息,并且在确定被集群的类中的另一个时使用所识别的信息作为约束。12.根据权利要求9所述的SaaS计算机实现的方法,还包括:在数据点的被集群的类中确定误分类测量;以及基于所述误分类测量来训练用于改进的集群的所述半监督k‑均值过程。13.根据权利要求9所述的SaaS计算机实现的方法,其中,所述分离超平面是被集群的类之间的非线性边界。14.一种生成用于机器学习的分类器引擎的计算机程序产品,所述计算机程序产品包2CN115935266A权利要求书2/2页括:程序指令,所述程序指令可由处理器执行以使所述处理器执行权利要求1‑13中任一项所述的方法。15.一种生成用于机器学习的分类器引擎的计算机服务器,包括:网络连接;处理器,其耦接到所述网络连接;以及16.一种计算机程序产品,其包括程序指令,所述程序指令在由所述处理器执行时执行权利要求1‑13中任一项所述的方法。3CN115935266A说明书1/11页用于分类的多‑多面体机器技术领域[0001]本公开总体上涉及数据处理,并且更具体地涉及用于分类的多‑多面体机器(multi‑polytopemachine)的系统和方法。背景技术[0002]二元分类(Binaryclassification)在机器学习中发挥着重要作用,并且与许多所应用的域相关。通常,训练集具有两个组,有时被标记为正性类和负性类。机器学习的目标是找到可以为测试点确定正确类的分类器。[00