预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共28页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN114998402A(43)申请公布日2022.09.02(21)申请号202210635312.4(22)申请日2022.06.07(71)申请人北京智源人工智能研究院地址100084北京市海淀区中关村东路1号院8号楼三层B201D-1(72)发明人唐路路黄铁军(74)专利代理机构北京动力号知识产权代理有限公司11775专利代理师梁艳(51)Int.Cl.G06T7/50(2017.01)G06V10/80(2022.01)G06V10/82(2022.01)G06N3/04(2006.01)G06N3/08(2006.01)权利要求书2页说明书19页附图6页(54)发明名称针对脉冲相机的单目深度估计方法及装置(57)摘要本申请提供一种针对脉冲相机的单目深度估计方法及装置,方法包括:获取脉冲相机输出的非结构化的连续脉冲流;将所述连续脉冲流输入预设的单目深度估计模型,以使得该单目深度估计模型从所述连续脉冲流中挖掘空间和时间特征,并输出所述连续脉冲流对应的深度估计结果。本申请能够同时从脉冲相机输出的连续脉冲流中挖掘空间和时间特征,能够有效提高对脉冲相机进行单目深度估计预测过程的可靠性,并能够提高深度估计结果的准确性及有效性,进而能够进一步提高脉冲相机的应用可靠智能化程度。CN114998402ACN114998402A权利要求书1/2页1.一种针对脉冲相机的单目深度估计方法,其特征在于,包括:获取脉冲相机输出的非结构化的连续脉冲流;将所述连续脉冲流输入预设的单目深度估计模型,以使得该单目深度估计模型从所述连续脉冲流中挖掘空间和时间特征,并输出所述连续脉冲流对应的深度估计结果。2.根据权利要求1所述的针对脉冲相机的单目深度估计方法,其特征在于,还包括:采用训练数据集对预设的时空Transformer网络模型进行训练,以得到用于从所述训练数据集中的连续脉冲流中挖掘空间和时间特征并输出连续脉冲流对应的深度估计结果的单目深度估计模型。3.根据权利要求2所述的针对脉冲相机的单目深度估计方法,其特征在于,所述训练数据集为一包含脉冲流和相应真实深度数据的合成脉冲数据集。4.根据权利要求2所述的针对脉冲相机的单目深度估计方法,其特征在于,还包括:获取预先采用所述脉冲相机收集的包含有各类场景的真实脉冲序列以形成对应的真实数据集;采用所述真实数据集对训练得到的所述单目深度估计模型进行泛化性验证。5.根据权利要求1所述的针对脉冲相机的单目深度估计方法,其特征在于,所述单目深度估计模型包括:脉冲嵌入模块和Transformer网络模型;所述脉冲嵌入模块用于提取脉冲流的时间及空间特征以得到对应的多个脉冲特征嵌入;所述Transformer网络模型用于获得各个脉冲嵌入的时空特征并对各个所述时空特征进行特征融合,以预测得到所述脉冲流的深度估计结果数据。6.根据权利要求5所述的针对脉冲相机的单目深度估计方法,其特征在于,所述Transformer网络模型包括:时空Transformer编码器和卷积解码器;所述时空Transformer编码器用于对各个所述脉冲嵌入通过多层自注意力机制进行时空特征提取,以得到各个所述脉冲嵌入的时空特征;所述卷积解码器用于对各个不同尺度的时空特征进行特征融合及上采样,以预测得到所述脉冲流的深度估计结果数据。7.根据权利要求5所述的针对脉冲相机的单目深度估计方法,其特征在于,所述脉冲嵌入模块包括:时间分区、特征提取层、空间分区及特征合并层,其中,所述时间分区设有多尺度时间窗口;相对应的,所述多尺度时间窗口用于将输入所述脉冲嵌入模块的脉冲流划分为多个不重叠的块;所述特征提取层用于提取各个不重叠块的特征数据,该特征数据包括:局部特征和全局特征;所述空间分区用于将所述特征数据在空间域中进行拆分,得到时空特征数据;所述特征合并层用于将时空特征数据中的全局特征和局部特征进行合并以得到所述脉冲流对应的多个时空块,并将各个所述时空块确定为待输入所述Transformer网络模型的脉冲嵌入。8.根据权利要求6所述的针对脉冲相机的单目深度估计方法,其特征在于,所述时空Transformer编码器包括多个阶段,且每个阶段中均包含有多个时空Transformer块,每两2CN114998402A权利要求书2/2页个相邻阶段之间设有一个残差连接层;其中,所述时空Transformer块包括:配备3D移位窗口的多头自注意MSA模块,以及,由多个MLP层组成的前馈神经网络FFN;每个所述MSA模块和FFN之间均设有一个GELU层,每个所述MSA模块和FFN之前设有一个归一化层LN。9.根据权利要求6所述的针对脉冲相机的单目深度估计方法,其特征在于,所述卷积解码器包括:多个残差块、多个特征融合层和一个