预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共12页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN115100405A(43)申请公布日2022.09.23(21)申请号202210566658.3G06N3/08(2006.01)(22)申请日2022.05.24(71)申请人东北大学地址110819辽宁省沈阳市和平区文化路3号巷11号(72)发明人郭楠李婧源高天寒(74)专利代理机构沈阳东大知识产权代理有限公司21109专利代理师李在川(51)Int.Cl.G06V10/26(2022.01)G06V10/774(2022.01)G06V10/80(2022.01)G06V10/82(2022.01)G06N3/04(2006.01)权利要求书2页说明书7页附图2页(54)发明名称面向位姿估计的遮挡场景目标检测方法(57)摘要本发明提供一种面向位姿估计的遮挡场景目标检测方法,该方法基于单阶段目标检测模型YOLOv5进行设计检测模型;采用特征融合的网络结构,对卷积层的浅层特征和深层特征进行了提取和融合,增加了相应的头部检测层,提高了模型的准确率和鲁棒性;在原始YOLOv5模型的基础上还对目标检测的优化算法进行了更改,使用了SoftNMS优化算法能够更好地避免YOLOv5模型在遮挡情况下存在的漏检问题,为了满足在资源有限设备上的部署,本发明还通过修改普通卷积层为深度可分离卷积,减小了模型的大小,不仅提高了检测模型的效率,检测结果更加准确有效。CN115100405ACN115100405A权利要求书1/2页1.一种面向位姿估计的遮挡场景目标检测方法,其特征在于,包括:步骤1:根据真实数据集和合成数据集制作数据集;步骤2:基于支持移动端的最小化模型YOLOv5n设计神经网络模型,作为目标检测模型;步骤3:对待检测图像进行预处理后作为目标检测模型的输入,通过目标检测模型预测目标物体。2.根据权利要求1所述的一种面向位姿估计的遮挡场景目标检测方法,其特征在于,所述步骤1包括:步骤1.1:基于Unity制作合成数据集;步骤1.2:利用数据集LineMOD数据集制作真实数据集;步骤1.3:划分训练集和测试集数据,其中训练集包括合成数据与真实数据,测试集为真实数据。3.根据权利要求2所述的一种面向位姿估计的遮挡场景目标检测方法,其特征在于,所述步骤1.1包括:步骤1.1.1:将LineMOD数据集中提供的.ply文件转换为.obj文件,获取目标物体的3D模型并导入到Unity3D中;步骤1.1.2:调用UnityPerception为背景设置位置随机化和旋转随机化来制作背景;步骤1.1.3:调用UnityPerception为步骤1.1.1中导入的模型制作标签。4.根据权利要求1所述的一种面向位姿估计的遮挡场景目标检测方法,其特征在于,所述步骤2包括:步骤2.1:对数据集中的图像进行预处理;步骤2.2:基于支持移动端的最小化模型YOLOv5n设计神经网络模型;步骤2.3:将步骤2.1处理后的图像作为神经网络模型的输入进行网络训练。5.根据权利要求4所述的一种面向位姿估计的遮挡场景目标检测方法,其特征在于,所述步骤2.1具体表述为:为了保证原始图像的目标物体不会产生形变,将图像进行等比例缩放后,再进行图像边缘的填充,使其缩放为640×640尺寸;随机选取4张缩放后的图像,并对4张图像进行剪裁;拼接剪裁后的4张图像为1张图像。6.根据权利要求4所述的一种面向位姿估计的遮挡场景目标检测方法,其特征在于,所述步骤2.2包括:步骤2.2.1:设计Pose‑YOLOv5特征提取网络,具体表述为:主干网络包括CBS、C3和SPP模块,其中SPP模块用于将局部特征和全局特征进行融合,CBS模块包含卷积层、批归一化层和SiLU激活层用来实现网络的下采样功能,C3模块包含C3_1、C3_2和C3_3三种模块,分别对应具备1个、2个和3个的残差模块,能够构建更深的网络,提升网络的特征提取能力;颈部网络包括上采样模块、连接模块、C3模块和CBS模块,其中,上采样模块用于恢复下采样后的图像特征,连接模块用于融合浅层特征和深层特征,C3模块和CBS模块用于实现卷积融合来获取最终的图像特征;头部网络作为Pose‑YOLOv5网络的输出端,所述头部网络包括CBS模块、卷积层,用于预测物体的位置信息和类别信息;深度可分离卷积层:逐通道卷积中一个卷积核对一个通道进行卷积,保证输入输出的2CN115100405A权利要求书2/2页通道数一致;逐点卷积对深度方向的特征进行加权组合,获取特征图;步骤2.2.2:利用SoftNMS算法来进行目标检测优化,实现对物体出现的多个冗余包围框的去除。7.根据权利要求4所述的一种面向位姿估计的遮挡场景目标检测方法,其特征在于,所述步骤2.3包括:1)初始化网络参数;2)损失函