视线预测方法、装置、系统和可读存储介质-豆柴文库

视线预测方法、装置、系统和可读存储介质.pdf

2024-01-06

10金币

1.4MB

27页

一吃****春晓

实名认证

内容提供者

1/10

2/10

3/10

4/10

5/10

6/10

7/10

8/10

9/10

10/10

亲，该文档总共27页，到这已经超出免费预览范围，如果喜欢就直接下载吧～

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN110008835A(43)申请公布日2019.07.12(21)申请号201910163152.6(22)申请日2019.03.05(71)申请人成都旷视金智科技有限公司地址611730四川省成都市郫都区德源镇(菁蓉镇)红旗大道北段223号申请人北京旷视科技有限公司(72)发明人罗堃铭刘东昊赵姗刘帅成(74)专利代理机构北京华进京联知识产权代理有限公司11606代理人朱五云(51)Int.Cl.G06K9/00(2006.01)G06N3/04(2006.01)G06N3/08(2006.01)权利要求书3页说明书16页附图7页(54)发明名称视线预测方法、装置、系统和可读存储介质(57)摘要本申请涉及一种视线预测方法、装置、系统和可读存储介质。所述方法包括：获取待处理的目标眼睛图像；将所述目标眼睛图像输入预先训练的视线预测模型，输出所述目标眼睛图像的预测视线向量；其中，所述视线预测模型是基于眼睛渲染图像训练样本的重构损失和预测视线损失、以及眼睛真实图像训练样本的重构损失训练得到的；所述预测视线损失包括：所述眼睛渲染图像训练样本的预测视线向量和标注视线向量之间的损失，所述眼睛渲染图像训练样本的预测视线向量是从所述眼睛渲染图像训练样本的眼睛图像中提取眼睛特征并预测得到的。采用本方法能够实现渲染域与真实域的跨域，可以提高视线预测的准确性。CN110008835ACN110008835A权利要求书1/3页1.一种视线预测方法，其特征在于，所述方法包括：获取待处理的目标眼睛图像；将所述目标眼睛图像输入预先训练的视线预测模型，输出所述目标眼睛图像的预测视线向量；其中，所述视线预测模型是基于眼睛渲染图像训练样本的重构损失和预测视线损失、以及眼睛真实图像训练样本的重构损失训练得到的；所述重构损失包括：各训练样本的眼睛图像和重构后的眼睛图像之间的损失，所述重构后的眼睛图像是从各训练样本的眼睛图像中提取眼睛特征并重构得到的；所述预测视线损失包括：所述眼睛渲染图像训练样本的预测视线向量和标注视线向量之间的损失，所述眼睛渲染图像训练样本的预测视线向量是从所述眼睛渲染图像训练样本的眼睛图像中提取眼睛特征并预测得到的。2.根据权利要求1所述的方法，其特征在于，所述眼睛渲染图像训练样本包括：眼睛渲染图像和标注视线向量；所述眼睛真实图像训练样本包括：眼睛真实图像；当所述视线预测模型的输入为所述眼睛渲染图像时，输出为所述眼睛渲染图像的预测视线向量和重构后的眼睛渲染图像；当所述视线预测模型的输入为所述眼睛真实图像时，输出为重构后的眼睛真实图像。3.根据权利要求2所述的方法，其特征在于，所述视线预测模型的训练方式，包括：获取眼睛渲染图像训练样本和眼睛真实图像训练样本；将所述眼睛渲染图像和眼睛真实图像分别输入初始的视线预测模型，得到重构后的眼睛渲染图像和重构后的眼睛真实图像，以及所述眼睛渲染图像的预测视线向量；根据所述眼睛渲染图像和重构后的眼睛渲染图像，计算所述眼睛渲染图像训练样本的重构损失；根据所述眼睛真实图像和重构后的眼睛真实图像，计算所述眼睛真实图像训练样本的重构损失；以及根据所述眼睛渲染图像的预测视线向量和标注视线向量，计算所述眼睛渲染图像训练样本的预测视线损失；根据所述眼睛渲染图像训练样本的重构损失和预测视线损失、以及所述眼睛真实图像训练样本的重构损失，对所述初始的视线预测模型进行训练，得到所述视线预测模型。4.根据权利要求3所述的方法，其特征在于，所述根据所述眼睛渲染图像训练样本的重构损失和预测视线损失、以及所述眼睛真实图像训练样本的重构损失，对所述初始的视线预测模型进行训练，得到所述视线预测模型，包括：根据重构损失和预测视线损失，计算预训练损失函数，以及根据所述预训练损失函数对所述初始的视线预测模型进行训练，得到预训练视线预测模型；所述重构损失包括所述眼睛渲染图像训练样本的重构损失和所述眼睛真实图像训练样本的重构损失；根据重构损失和预测视线损失，计算目标训练损失函数，以及根据所述目标训练损失函数对所述预训练视线预测模型再次进行训练，得到所述视线预测模型；所述目标训练损失函数中重构损失的比重小于所述预训练损失函数中重构损失的比重。5.根据权利要求4所述的方法，其特征在于，所述预训练损失函数包括：Lg+β1Lr，其中，Lg为预测视线损失，Lr为重构损失，β1为预训练损失函数中重构损失和预测视线损失之间的偏置项；所述目标训练损失函数包括：Lg+β2Lr，其中，β2为目标训练损失函数中重构损失和预测视线损失之间的偏置项，且β1>β2>0。2CN110008835A权利要求书2/3页6.根据权利要求3所述的方法，其特征在于，所述视线预测模型包括：特征提取子模型、视线预测子模型和重构

相关资料

视线预测方法、装置、系统和可读存储介质.pdf

本申请涉及一种视线预测方法、装置、系统和可读存储介质。所述方法包括：获取待处理的目标眼睛图像；将所述目标眼睛图像输入预先训练的视线预测模型，输出所述目标眼睛图像的预测视线向量；其中，所述视线预测模型是基于眼睛渲染图像训练样本的重构损失和预测视线损失、以及眼睛真实图像训练样本的重构损失训练得到的；所述预测视线损失包括：所述眼睛渲染图像训练样本的预测视线向量和标注视线向量之间的损失，所述眼睛渲染图像训练样本的预测视线向量是从所述眼睛渲染图像训练样本的眼睛图像中提取眼睛特征并预测得到的。采用本方法能够实现渲染域

2024-01-06

1.4MB

系统日前短期负荷预测方法、装置、设备和可读存储介质.pdf

本发明涉及一种系统日前短期负荷预测方法、装置、设备和可读存储介质，该方法包括：采集历史数据，并对历史数据进行预处理；利用预处理后的历史数据构建训练样本集；利用训练样本集对预先建立的XGBoost多目标回归模型进行训练，得到训练后的XGBoost多目标回归模型；生成预测样本特征；将预测样本特征输入至训练后的XGBoost多目标回归模型，得到预测的短期负荷。本申请提供的技术方案，不仅提高了模型训练、部署和预测的效率，还提高了短期负荷预测的精准度。

2023-07-25

444KB

人像处理方法、装置、系统和可读存储介质.pdf

本申请涉及一种人像处理方法、装置、系统和可读存储介质。该方法包括：获取待处理人像，并生成待处理人像的多个候选裁剪框；将待处理人像输入骨架检测网络模型进行骨架检测处理，得到待处理人像的骨架节点位置；以及根据各候选裁剪框和骨架节点位置，计算各候选裁剪框的第一类美学量化值；根据各候选裁剪框，对待处理人像进行裁剪处理，得到待处理人像的各候选裁剪图像；以及将各候选裁剪图像输入美学网络模型，得到各候选裁剪框的第二类美学量化值；根据各候选裁剪框的第一类美学量化值，和/或第二类美学量化值，选择至少一个候选裁剪框作为待处理

2024-01-10

1.7MB

监测方法、装置、门禁系统和可读存储介质.pdf

本申请提供一种监测方法、装置、门禁系统和可读存储介质，其中，该方法包括：响应于目标对象发起的开门请求，控制门禁开启，获取在门禁中通行的目标物与预设位置点之间的距离数据，根据距离数据，确定在门禁中通行的目标物的尺寸特征，根据目标物的尺寸特征和预设尺寸数据，得到监测结果。该技术方案中，通过监测目标物在进入门禁时与设置在门禁侧边的预设位置点之间的距离，确定目标物的尺寸特征，能够自动准确的判别出该目标物是否为有授权的目标对象，提高监测准确度。

2023-07-25

872KB

位置预测方法、装置及可读存储介质.pdf

本发明公开了一种位置预测方法，该位置预测方法包括：获取移动终端对应的第一预设时间段内的位置数据；对位置数据进行聚类，并根据所述聚类形成停留点数据；根据停留点数据构建预测模型，通过预测模型预测所述移动终端的目标位置，以及所述目标位置对应的目标概率值。本发明还公开了一种用户位置预测装置和一种可读存储介质。本发明能够从应用中获取的分散位置数据中挖掘构建预测模型，预测所述移动终端的目标位置，以及所述目标位置出现的目标概率值，向用户推荐基于位置的产品和服务。

2023-11-15

1.4MB