一种基于伪标签的视线估计方法-豆柴文库

一种基于伪标签的视线估计方法.pdf

2023-11-05

10金币

486KB

7页

岚风****55

实名认证

内容提供者

1/7

2/7

3/7

4/7

5/7

6/7

7/7

在线预览结束，喜欢就下载吧，查找使用更方便

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN114973356A(43)申请公布日2022.08.30(21)申请号202210484571.1(22)申请日2022.05.06(71)申请人中国科学院上海微系统与信息技术研究所地址200050上海市长宁区长宁路865号(72)发明人李嘉茂车何框亿朱冬晨林敏静李航张晓林(74)专利代理机构上海泰博知识产权代理有限公司31451专利代理师钱文斌(51)Int.Cl.G06V40/16(2022.01)G06V40/18(2022.01)G06V10/774(2022.01)G06V10/764(2022.01)权利要求书1页说明书4页附图1页(54)发明名称一种基于伪标签的视线估计方法(57)摘要本发明涉及一种基于伪标签的视线估计方法，包括以下步骤：获取面部图像；将所述面部图像输入至训练好的视线评估模型中进行预测得到预测视线；其中，所述视线评估模型在训练时，使用少量有标签的真实训练集对模型进行训练，得到预训练模型，根据增加了随机失活层的所述预训练模型对无标签的数据打上伪标签，计算所述伪标签的不确定值，并保留所述不确定值小于阈值的伪标签对应的数据，将保留的伪标签对应的数据和真实训练集一起重新训练模型，如此循环迭代直至训练完毕，得到所述视线评估模型。本发明大大减轻了视线估计对人工标签的依赖性。CN114973356ACN114973356A权利要求书1/1页1.一种基于伪标签的视线估计方法，其特征在于，包括以下步骤：获取面部图像；将所述面部图像输入至训练好的视线评估模型中进行预测得到预测视线；其中，所述视线评估模型在训练时，使用少量有标签的真实训练集对模型进行训练，得到预训练模型，根据增加了随机失活层的所述预训练模型对无标签的数据打上伪标签，计算所述伪标签的不确定值，并保留所述不确定值小于阈值的伪标签对应的数据，将保留的伪标签对应的数据和真实训练集一起重新训练模型，如此循环迭代直至训练完毕，得到所述视线评估模型。2.根据权利要求1所述的基于伪标签的视线估计方法，其特征在于，所述根据增加了随机失活层的所述预训练模型对无标签的数据打上伪标签具体为：将同一个无标签的数据多次输入打开随机失活层的所述预训练模型中得到的多个伪标签。3.根据权利要求2所述的基于伪标签的视线估计方法，其特征在于，所述计算所述伪标签的不确定值具体为：计算多个伪标签的均值，将所述均值作为所述无标签的数据的视线伪标签；计算多个所述伪标签的标准差，将所述标准差作为所述伪标签的不确定值。4.根据权利要求1所述的基于伪标签的视线估计方法，其特征在于，所述模型的损失函数为：其中，是模型对真实训练集图像的预测结果，ytrain是真实训练集的真实标签，是模型对伪标签数据的预测结果，ypseudo是保留的伪标签，α是伪标签数据的权重信息。5.根据权利要求1所述的基于伪标签的视线估计方法，其特征在于，所述视线评估模型包括：主干网络，用于从所述面部图像中提取出特征表示；全连接层，用于从所述特征表示中回归出预测视线；在对无标签的数据打上伪标签时，所述随机失活层设置在所述主干网络和全连接层之间。2CN114973356A说明书1/4页一种基于伪标签的视线估计方法技术领域[0001]本发明涉及视线估计技术领域，特别是涉及一种基于伪标签的视线估计方法。背景技术[0002]视线估计方法可以分为基于模型的方法和基于表观的方法，基于模型的方法从人眼或人脸图像中计算关键点，结合三维人眼模型预测视线；基于表观的方法直接从人眼或人脸图像中提取特征以预测视线。基于模型的方法准确率高，但依赖于红外相机等专业设备，通常局限于室内场景；基于表观的方法不依赖于专业设备，在室内室外场景都适用，但准确率相对较低。[0003]得益于深度学习的发展，基于表观的深度学习方法在精度上有了巨大的提升，已经超越了传统机器学习的方法，但是深度学习依赖于大规模的数据集，现有的视线估计数据集场景单一，图像数量相对较少，制约了算法性能的进一步提升，如何在现有数据集上生成更多的有标签数据成了研究重点。[0004]直观的想法就是给无标签的数据打上伪标签，这样就能以较低的代价得到大量有标签数据。Ghosh等人先检测出眼部关键点，然后使用关键点结合人眼三维模型估计视线伪标签；这种方法严重依赖于眼部关键点检测算法，而且不同人的眼部生理结构存在差异，用同一个人眼模型无法兼顾个体的差异。Kothari等人利用人在交谈时相互看着对方的特性，设计了眼部视线的伪标签，但是这些方法依赖于特定场景，无法保证交谈者时刻盯着对方。[0005]Cheng等人首次将VisionTransformer(ViT)引入到视线估计领域，他们首先用残差网络提取面部图像的特征图，然后将特征图作为transforme

相关资料

一种基于伪标签的视线估计方法.pdf

本发明涉及一种基于伪标签的视线估计方法，包括以下步骤：获取面部图像；将所述面部图像输入至训练好的视线评估模型中进行预测得到预测视线；其中，所述视线评估模型在训练时，使用少量有标签的真实训练集对模型进行训练，得到预训练模型，根据增加了随机失活层的所述预训练模型对无标签的数据打上伪标签，计算所述伪标签的不确定值，并保留所述不确定值小于阈值的伪标签对应的数据，将保留的伪标签对应的数据和真实训练集一起重新训练模型，如此循环迭代直至训练完毕，得到所述视线评估模型。本发明大大减轻了视线估计对人工标签的依赖性。

2023-11-05

486KB

一种基于伪标签融合的双目深度估计方法.pdf

本发明涉及自动驾驶技术领域，具体来说是一种基于伪标签融合的双目深度估计方法，包括通过双目相机获得左右图；对左右图进行立体匹配，计算出深度图作为伪标签；还包括：通过深度图和置信度网络对左右图进行训练，获得深度图与置信度图；将深度图、置信度图和立体匹配的深度图结合，放入融合网络；获取融合后的深度图，并与真值计算损失函数，反向传播训练模型。本发明所提供的一种基于伪标签融合的双目深度估计方法，既能保留深度学习方法泛化能力强的优势，又能结合传统方法精度高的优点，使本发明的深度图系统在各场景环境下均能保持良好的精度与

2023-07-25

796KB

一种基于生成对抗网络的视线估计方法.pdf

本发明中提出的一种基于生成对抗网络的视线估计方法，其主要内容包括：生成纹理、生成真实数据和对眼部进行细化，其过程为，先自动将面部图像与3D模型的水平方向和垂直方向的纹理空间对齐，然后不成对的像素级别域适应技术将合成图像映射到真实域，再使用视线方向的注释和合成数据预训练视线方向估计器，最后在整个映射过程中执行细化网络以保持视线方向，使用预训练网络作为从合成到真实再到合成的转换循环约束。本发明使用新颖的对抗训练方法，将渲染的合成图像映射到逼真的域，可以在实际图像上获得更准确的视线估计，而不需要使用任何来自真实

2024-01-06

847KB

一种基于伪标签的人脸图像高光去除方法.pdf

本发明涉及图像处理、计算机视觉及深度学习领域，特别涉及一种基于伪标签的人脸图像高光去除方法，包括通过渲染引擎获取合成人脸数据集，与真实带高光人脸图像组成带标签数据集和无标签数据集；使用带标签数据集对卷积神经网络进行训练；使用伪标签的方法，提升神经网络的泛化能力；将带高光的人脸图像输入卷积神经网络，得到去除高光的图片；本发明得到的人脸去高光图像符合人脸观测效果，且不会损伤人脸纹理细节。

2024-01-06

1MB

一种基于元学习与伪标签策略的增量语义分割方法.pdf

本发明公开了一种基于元学习与伪标签策略的增量语义分割方法，包括：建立模型；表征训练，在每个增量步开始阶段，冻结除了特征提取器外的其他网络结构，利用临时分割头训练特征提取器；知识连接，仅更新掩码生成器与分割头的参数，冻结其他结构的参数，特征提取器提取训练数据的特征，掩码生成器生成掩码对语义分割网络进行分割；知识更新，利用元学习策略训练共享知识库，更新参数，进而获取可重复使用的知识以面对新任务；知识巩固，再次对掩码生成器与分割头进行训练，以巩固共享知识库中的新知识。本发明采用元学习算法可缓解模型对旧任务的遗忘

2023-05-25

1.5MB