预览加载中,请您耐心等待几秒...
1/2
2/2

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

基于分层分数条件随机场的行为识别0引言行为识别在人机交互、视觉跟踪、机器人、基于内容的视频检索等计算机视觉领域是一个非常活跃和有潜力的研究课题[1-2]。目前研究较多的条件随机场(ConditionalRandomFieldCRF)模型[3-4]实现了在整个状态空间上的全局归一化分布将丰富的上下境特征融合到模型中但是CRF模型不能表达序列的子结构。为了解决这一问题文献[5]提出了隐条件随机场(HiddenCRFHCRF)模型实现了空间相关性的建模但是该模型是一种脱机识别模型。为了解决HCRF模型的实时性问题文献[6]提出了隐动态条件随机场(LatentDynamicCRFLDCRF)该模型训练姿态标记间的动态特性可以直接标记未分割序列但LDCRF模型对于行为转换时的标记存在偏差无法直观地显示行为的转变。针对LDCRF标记偏差问题本文对该模型加以改进提出了分层分数条件随机场(StratifiedFractionCRFSFCRF)模型模型分为上、下两层分别训练共同识别互相补充校正将该模型应用于人体行为识别取得了较好的识别效果。1分层分数条件随机场1.1条件随机场模型CRF是判别式马尔可夫模型的一种CRF能够对观测序列的任意特征建模能够适应重叠特征。通过最大化分类器判别权值训练CRF参数而不训练样本的联合概率。在视频序列存在子结构的情况下CRF不能对其建模。Wang等[5]将隐变量加入CRF提出HCRF模型来解决子结构问题。目前HCRF已经应用在视觉和语音领域[7-10]。在视觉领域HCRF已被用在目标识别中复杂图像的空间关联建模[8]对分割的图像序列识别手臂和头部姿态[6]。在语音识别领域类似的模型应用在电话分类领域[10]。HCRF采用预分割序列集训练模型仅能获取内在结构而不能捕获姿态标记间的动态特性。Sutton等[11]提出了动态条件随机场(DynamicCRFDCRF)模型在视频序列训练和识别过程中需要反复修正模型的结构和参数训练包含未观测节点的DCRF模型(隐变量)会使得该方法难以最优化。Morency等[6]将LDCRF融合了带有显式分割的隐态变量:在训练和测试阶段采用置信传播可以有效计算得到隐态变量的结构和参数有效地解决HCRF未分割序列无法标记的问题。LDCRF融合隐态变量建立姿态序列的子结构可以训练姿态标记间的动态特性直接应用于标记未分割序列。但是对于行为之间的转换LDCRF无法正确标记转换过程中的行为仅能依据概率作出标记。