预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共22页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN114820752A(43)申请公布日2022.07.29(21)申请号202210282978.6(22)申请日2022.03.22(71)申请人支付宝(杭州)信息技术有限公司地址310000浙江省杭州市西湖区西溪路556号8层B段801-11(72)发明人王珂马晨光陈志远陈智泉胡永恒王泽荣方硕李瑞达马兵(74)专利代理机构北京市一法律师事务所11654专利代理师李琳娜刘荣娟(51)Int.Cl.G06T7/55(2017.01)G06N3/04(2006.01)G06N3/08(2006.01)权利要求书2页说明书14页附图5页(54)发明名称深度估计方法和系统(57)摘要本说明书提供的深度估计方法和系统,获取目标物体的异质双目图像,对所述异质双目图像进行跨域迁移处理生成同质双目图像,将所述同质双目图像输入深度估计网络模型,能够准确地获取所述深度估计网络模型输出的所述目标物体的深度图,而且不依赖3D摄像头,达到了降本增效的效果。CN114820752ACN114820752A权利要求书1/2页1.一种深度估计方法,包括:获取目标物体的异质双目图像,所述异质双目图像包括所述目标物体在第一视觉域中的第一原始图像和在第二视觉域中的第二原始图像,所述第一视觉域不同于所述第二视觉域;对所述异质双目图像进行跨域迁移处理生成同质双目图像,所述同质双目图像包括第一目标图像和第二目标图像,所述第一目标图像和所述第二目标图像的视觉域相同;以及将所述同质双目图像输入深度估计网络模型,获取所述深度估计网络模型输出的所述目标物体的深度图。2.如权利要求1所述的方法,其中所述深度估计网络模型在计算所述深度图的过程中不获取视差信息。3.如权利要求1所述的方法,其中所述跨域迁移处理包括:对所述第一原始图像进行跨域迁移,生成伪域图像,所述伪域图像在所述第二视觉域;以及对所述伪域图像进行图像校准,生成所述第一目标图像。4.如权利要求3所述的方法,其中所述对所述第一原始图像进行跨域迁移,生成伪域图像包括:将所述第一原始图像输入目标生成对抗网络模型进行跨域迁移,生成所述伪域图像。5.如权利要求1所述的方法,其中所述跨域迁移处理包括:对所述第一原始图像进行图像校准,生成第一校准图像;以及对所述第一校准图像进行跨域迁移,生成所述第一目标图像,所述第一目标图像在第二视觉域。6.如权利要求5所述的方法,其中所述对所述第一校准图像进行跨域迁移,生成所述第一目标图像包括:将所述第一校准图像输入目标生成对抗网络模型进行跨域迁移,生成所述第一目标图像。7.如权利要求4或6所述的方法,其中所述目标生成对抗网络模型是基于所述第一视觉域中的多个样本图像对初始生成对抗网络模型训练得到的,每个样本图像对应有标签,所述标签是指通过与所述多个样本图像视角相同的第二视觉域的摄像头拍摄的图像,所述初始生成对抗网络模型对所述每个样本图像进行处理得到所述每个样本图像的预测值,以所述预测值与所述标签的偏差在预设范围内为优化目标训练所述初始生成对抗网络模型。8.如权利要求1所述的方法,其中所述跨域迁移处理还包括:对所述第二原始图像进行图像校准,生成所述第二目标图像。9.如权利要求1所述的方法,其中所述第一目标图像与所述第二目标图像为共面图像且行对准,所述行对准是指所述第一目标图像中的任一像素点A所在的像素行,和所述第二目标图像中与所述像素点A匹配的像素点B所在的像素行是同一行,所述像素点A和所述像素点B对应所述目标物体的同一点。10.如权利要求1所述的方法,其中所述深度估计网络模型是通过将样本物体的真实深度图作为监督图进行训练得到的网络模型。11.一种深度估计系统,包括:2CN114820752A权利要求书2/2页至少一个存储介质,存储有至少一组指令集用于深度估计;以及至少一个处理器,同所述至少一个存储介质通信连接,其中当所述深度估计系统运行时,所述至少一个处理器读取所述至少一个指令集并实施权利要求1‑10中任一项所述的深度估计方法。3CN114820752A说明书1/14页深度估计方法和系统技术领域[0001]本说明书涉及图像处理技术领域,尤其涉及一种深度估计方法和系统。背景技术[0002]深度估计可以理解为:通过图像采集装置采集物体的图像,利用物体的图像估计物体各点到图像采集装置的成像平面的垂直距离,该垂直距离即为该物体上对应点的深度信息。[0003]现有技术中,深度信息被广泛应用于各个领域,如自动驾驶领域、人脸识别领域等。以人脸识别为例,目前大部分IoT(InternetofThings,物联网)设备上使用的刷脸机具一般会搭载3D结构光摄像头来获取人脸的深度图,也就得到了人脸的深度信息。3D结构光摄像头是指利用结构光和三角测量的原理进