预览加载中,请您耐心等待几秒...
1/8
2/8
3/8
4/8
5/8
6/8
7/8
8/8

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局*CN102226909A*(12)发明专利申请(10)申请公布号CN102226909A(43)申请公布日2011.10.26(21)申请号201110166147.4(22)申请日2011.06.20(71)申请人夏东地址410000湖南省长沙市开福区网船班路10号世纪春天锦园3栋J座(72)发明人夏东(51)Int.Cl.G06K9/46(2006.01)G06K9/66(2006.01)G06F9/46(2006.01)权利要求书1页说明书5页附图1页(54)发明名称多核集群系统的并行AdaBoost特征提取方法(57)摘要本发明公开了一种多核集群系统的并行AdaBoost特征提取方法,该方法将AdaBoost的每轮迭代过程用如下方法进行改造:首先将AdaBoost训练过程中需要扫描的特征集合进行划分,均匀分布在多核集群系统的各个结点上;然后,每个计算结点则进一步将分配给自己的特征子集合进行划分,分别由不同的计算核心进行扫描并收集各个计算核心的计算结果,得到特征子集合上的最优特征;接着集群系统将各个结点得到的特征子集合上的最优特征进行规约,从而特到全局最优特征。该方法能够充分发挥多核集群系统的并行处理能力,从而极大地加速AdaBoost特征提取过程。CN10269ACCNN110222690902226918A权利要求书1/1页1.多核集群系统的并行AdaBoost特征提取方法,设给定的多核集群系统包含个计算机结点,每个计算机结点拥有个处理器核,其特征在于,包括以下步骤:(1)、每个计算机结点启动一个进程,一个主进程和p-1个从进程,主进程执行特征集合分布过程,将特征集合分为p个子集合,分布到p个计算机结点上,同时每个计算机结点都将保留一份样本集合的本地副本;(2)、每个进程执行特征子集合并行扫描过程,启动Q个线程对分配给自己的子集合进行扫描,选出该子集合中的最优特征;进而,集群系统执行特征规约过程,将个子集合的最优特征进行一次并行规约,得到整个特征集合的全局最优特征并保存在主进程中;(3)、主进程将全局最优特征通过广播发送给所有从进程,以便所有进程都能够依据全局最优特征更新样本集合的本地副本中各个样本的权重值;最终,经过多次迭代,主进程将得到一个由多个特征组合而成的特征分类器。2.根据权利要求1所述的多核集群系统的并行AdaBoost特征提取方法,其特征在于,所述特征集合分布过程包含三个子步骤:(1)对训练过程中将要使用的特征集合内的个特征进行编码,每个特征都用一个整数表示,这样,一个整数区间,就可以表示一个特征集合的子集合;(2)主进程将代表个特征子集合的整数区间分别发送给个从进程;(3)每个从进程接收到整数区间后,依据该整数区间重建特征子集合。3.根据权利要求1所述的多核集群系统的并行AdaBoost特征提取方法,其特征在于,所述特征子集合并行扫描过程包含三个子步骤:(1)将收到的整数区间均匀划分为个子区间;(2)启动个线程,每个线程负责对子区间所对应的特征集合进行扫描,并选出该特征集合的最优特征;(3)对个线程得到的个局部最优特征进行评估,获得区间所对应的特征集合的最优特征。2CCNN110222690902226918A说明书1/5页多核集群系统的并行AdaBoost特征提取方法技术领域[0001]本发明涉及大规模并行计算领域和模式识别领域,是一种利用多核集群系统加速AdaBoost特征提取的方法。背景技术[0002]基于AdaBoost机器学习算法的特征提取方法是目前流行的特征提取方法之一。Adaboost机器学习算法是解决二类划分问题,如确定一幅图片是否是人脸图片,的有效方法,该方法依据给定的样本集合(包括正样本和负样本)对该类样本的特征集合(如Haar特征集合)进行筛选,进而将筛选出的特征经过加权构成一个分类器。由该方法得到的分类器具备较高的准确度和鲁棒性,被广泛应用于各种模式识别系统中,如人物检测、人脸检测、人眼检测系统等等。[0003]AdaBoost算法主要由一个迭代循环构成,这个迭代循环又分为三个步骤:最优特征筛选、误差评估和样本权重更新。其中最优特征筛选需要遍历整个特征集合,选出分类效果最好的特征,误差评估则对选出的特征进行评估,计算其分类的误差;样本权重更新则是根据刚刚选出的特征的误差对样本的权重进行调整,以便在下次迭代时针对新的样本权重选出新的最优特征。从整个算法流程来讲,样本集合及其权重是其核心数据结构,每次迭代都需要对所有的特征进行评估,从而得出误差最小的特征,并加入分类器中。对特征进行评估的过程中,需要使用该特征对样本库中的所有样本计算分类值,并依据该分类值对样本进行排序,进而求出该特征的最优阈值。[0004]AdaBoost机器学习算法具有较高的