基于YOLOv4-tiny模型的工件类别与位姿估计方法-豆柴文库

基于YOLOv4-tiny模型的工件类别与位姿估计方法.pdf

2023-07-21

10金币

1.2MB

16页

a是****澜吖

实名认证

内容提供者

1/10

2/10

3/10

4/10

5/10

6/10

7/10

8/10

9/10

10/10

亲，该文档总共16页，到这已经超出免费预览范围，如果喜欢就直接下载吧～

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN115100136A(43)申请公布日2022.09.23(21)申请号202210697551.2G06V10/82(2022.01)(22)申请日2022.06.20G06N3/04(2006.01)G06N3/08(2006.01)(71)申请人华南理工大学地址510640广东省广州市天河区五山路381号(72)发明人张铁郭亮亮邹焱飚(74)专利代理机构广州市华学知识产权代理有限公司44245专利代理师郑秋松(51)Int.Cl.G06T7/00(2017.01)G06T7/73(2017.01)G06V10/44(2022.01)G06V10/764(2022.01)G06V10/766(2022.01)权利要求书3页说明书9页附图3页(54)发明名称基于YOLOv4-tiny模型的工件类别与位姿估计方法(57)摘要本发明公开了一种基于YOLOv4‑tiny模型的工件类别与位姿估计方法，包括以下步骤：S1、对YOLOv4‑tiny模型的特征提取网络进行轻量化，特征提取网络对输入图像进行特征提取并输出不同尺度的特征图；S2、设置多组不同宽高和旋转角度的锚框，并分派到不同尺度的特征图上，根据模型输出的预测结果生成相应的预测框；S3、采集目标工件的图像数据，使用旋转边界框对目标工件的类别和位姿进行标注，通过数据增广预处理后获得数据集；S4、利用数据集对YOLOv4‑tiny模型进行迭代训练，训练至损失函数不再下降，获取检测工件的最优YOLOv4‑tiny模型；S5、利用最优YOLOv4‑tiny模型执行在线网络推理，对模型的预测结果进行后处理，预测目标工件的类别、位置和姿态。本发明能实现高效的工件视觉分类和位姿估计。CN115100136ACN115100136A权利要求书1/3页1.一种基于YOLOv4‑tiny模型的工件类别与位姿估计方法，其特征在于，包括以下步骤：S1、对YOLOv4‑tiny模型的特征提取网络进行轻量化，特征提取网络对输入图像进行特征提取并输出不同尺度的特征图；S2、设置多组不同宽高和旋转角度的锚框，并分派到不同尺度的特征图上，根据模型输出的预测结果生成相应的预测框；S3、采集目标工件的图像数据，使用旋转边界框对目标工件的类别和位姿进行标注，通过数据增广预处理后获得数据集；S4、利用数据集对YOLOv4‑tiny模型进行迭代训练，训练至损失函数不再下降，获取检测工件的最优YOLOv4‑tiny模型；S5、利用最优YOLOv4‑tiny模型执行在线网络推理，对模型的预测结果进行后处理，预测目标工件的类别、位置和姿态。2.如权利要求1的基于YOLOv4‑tiny模型的工件类别与位姿估计方法，其特征在于，步骤S1中，使用可分离幻影卷积模块对YOLOv4‑tiny模型的特征提取网络进行轻量化，可分离幻影卷积模块包括逆深度可分离卷积和通道卷积线性运算，逆深度可分离卷积用于生成固有特征图，通道卷积线性运算用于生成幻影特征图；逆深度可分离卷积可分解为点卷积和深度卷积，点卷积用于处理输入特征图的通道信息，深度卷积用于处理输入特征图的空间信息。3.如权利要求2的基于YOLOv4‑tiny模型的工件类别与位姿估计方法，其特征在于，使用可分离幻影卷积替换标准卷积时，计算量的压缩比为：其中，ci为输入通道数，co为输出通道数，wi为输入特征图的宽，hi为输入特征图的高，wo为输出特征图的宽，ho为输出特征图的高，s为压缩比参数，d为通道卷积线性运算的核尺寸大小，k为原标准卷积的核尺寸大小，d≈k且s＜＜ci，ci＞＞1。4.如权利要求1的基于YOLOv4‑tiny模型的工件类别与位姿估计方法，其特征在于，步骤S2中，设置6组不同宽高的锚框，并为每组锚框设置6组不同的旋转角度，然后将各组锚框分派到不同尺度的输出特征图，分别回归大目标和小目标。5.如权利要求1的基于YOLOv4‑tiny模型的工件类别与位姿估计方法，其特征在于，步骤S3中，使用长边表示法对采集的目标工件图像数据进行参数标注，具体方式为：使用参数集{x,y,w,h,θ,cls}来表示旋转边界框，其中，x和y表示边界框中心点的坐标，w表示边界框的宽，h表示边界框的高，宽指长边，高指短边，θ是长边与X轴正向的夹角，逆时针方向为正，顺时针方向为负，cls为工件类别。2CN115100136A权利要求书2/3页6.如权利要求1的基于YOLOv4‑tiny模型的工件类别与位姿估计方法，其特征在于，步骤S3中，制作数据集时使用数据增广的方式对原始数据集进行扩充，具体为：对采集的目标工件图像使用随机缩放、旋转和平移的数据增广方法，并对标签数据作相应的变换，然后为图像数据添加随机高斯噪音，利用黑色像素将图像数据填充为

相关资料

基于YOLOv4-tiny模型的工件类别与位姿估计方法.pdf

本发明公开了一种基于YOLOv4‑tiny模型的工件类别与位姿估计方法，包括以下步骤：S1、对YOLOv4‑tiny模型的特征提取网络进行轻量化，特征提取网络对输入图像进行特征提取并输出不同尺度的特征图；S2、设置多组不同宽高和旋转角度的锚框，并分派到不同尺度的特征图上，根据模型输出的预测结果生成相应的预测框；S3、采集目标工件的图像数据，使用旋转边界框对目标工件的类别和位姿进行标注，通过数据增广预处理后获得数据集；S4、利用数据集对YOLOv4‑tiny模型进行迭代训练，训练至损失函数不再下降，获取检测

2023-07-21

1.2MB

基于EIV模型的点线位姿估计研究的综述报告.docx

基于EIV模型的点线位姿估计研究的综述报告随着计算机视觉技术的不断发展，点线位姿估计在工业、机器人、军事领域等方面得到了广泛的应用。点线位姿估计是指在二维或三维空间中通过检测点、线等基本几何元素，估计目标物体的姿态信息。在工业中，点线位姿估计被广泛应用于计算机视觉导航、自适应机器人等领域。在军事领域中，点线位姿估计被用于目标检测、目标跟踪等方面。在本综述报告中，将针对基于EIV模型的点线位姿估计研究进行分析和总结。1.EIV模型的基本理论EIV（Errors-In-Variables）模型是指在估计过程中

2024-09-18

10KB

面向无序堆叠工件抓取的位姿估计方法研究的开题报告.docx

面向无序堆叠工件抓取的位姿估计方法研究的开题报告一、研究背景随着智能制造的不断发展，自动化生产线的普及，机器人技术得到了广泛的应用。而在现实生产中，机器人抓取工件是非常重要的一个环节。然而，对于无序堆叠的物品，传统的机器人抓取技术存在着一定的局限性，这给机器人的抓取带来了一定的困难。在无序堆叠工件抓取中，机器人需要实时感知堆叠工件的位姿信息，以便实现精准的抓取。因此，需要对位姿估计方法进行研究。目前，深度学习技术被广泛应用于位姿估计方面，具有较高的精度和实时性。因此，本文基于深度学习技术，研究面向无序堆叠

2024-09-25

11KB

基于特征点对的位姿估计方法研究的综述报告.docx

基于特征点对的位姿估计方法研究的综述报告特征点对是计算机视觉中广泛使用的一种简单而有效的方法，用于位姿估计、目标检测、匹配等领域。在本篇综述中，我们将主要探讨基于特征点对的位姿估计方法的研究进展和应用。一、特征点对的定义和分类特征点对是指从图像中提取出来的具有独特性质和描述性特征的图像点对，通常被用于描述图像中的目标物体。常见的特征点对包括图像中的角点、边缘、斑块等。特征点对的分类可以按照特征点的类别、选择和匹配的方式等多种角度进行。按照特征点的类别来看，可分为SIFT、SURF、ORB等几种类型。按照选

2024-09-19

10KB

位姿估计方法、装置、设备及介质.pdf

本公开涉及一种位姿估计方法、装置、设备及介质,该方法包括:获取车辆在T时刻和T+1时刻之间的轮速计观测数据;根据预设轮速计模型和车辆运动学模型,获取轮速计观测数据表征的车辆名义状态的时间导数;对轮速计观测数据表征的车辆名义状态的时间导数进行数值积分,基于积分结果获取车辆在T时刻和T+1时刻之间的名义位姿增量;根据误差传播算法、轮速计模型、车辆运动学模型以及车辆名义状态的时间导数,得到T时刻和T+1时刻之间对应的轮速计误差置信度;根据指定传感器在T时刻观测数据和T+1时刻观测数据、轮速计观测数据对应的名义位

2023-05-09

1.4MB