基于深度学习的仿生机器孔雀图像识别方法-豆柴文库

基于深度学习的仿生机器孔雀图像识别方法.pdf

2023-12-05

10金币

695KB

11页

Ja****20

实名认证

内容提供者

1/10

2/10

3/10

4/10

5/10

6/10

7/10

8/10

9/10

10/10

亲，该文档总共11页，到这已经超出免费预览范围，如果喜欢就直接下载吧～

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN108038455A(43)申请公布日2018.05.15(21)申请号201711374581.5(22)申请日2017.12.19(71)申请人中国科学院自动化研究所地址100190北京市海淀区中关村东路95号(72)发明人李成荣胡耀聪周世久徐玉龙李名扬(74)专利代理机构北京八月瓜知识产权代理有限公司11543代理人马东瑞(51)Int.Cl.G06K9/00(2006.01)G06N3/00(2006.01)G06N3/04(2006.01)权利要求书2页说明书5页附图3页(54)发明名称基于深度学习的仿生机器孔雀图像识别方法(57)摘要本发明公开了基于深度学习的仿生机器孔雀的图像识别方法，包括以下步骤：采集公开的人脸检测数据库作为训练和验证的图像数据集；设计基于卷积神经网络的深度学习架构，在深度学习架构内实现人脸检测功能；采集仿生机器孔雀摄像头所拍摄到的现场图像对训练好的卷积神经网网进行微调，实现室内复杂环境下的人脸检测功能；得到经验参数以确定观众的着装定位，并统计各种颜色所占的相应比重；本发明实现娱乐仿生机器人在复杂环境下准确高效的人脸检测和颜色识别，鲁棒性好；且对现场图像对训练好的深度学习架构进行参数微调；最后实现对于摄像头捕捉到的现场图像进行实时人脸检测和着装识别；可以应用于科技馆、酒店、商场、供游客参观、娱乐。CN108038455ACN108038455A权利要求书1/2页1.基于深度学习的仿生机器孔雀的图像识别方法，其特征在于，包括以下步骤：S1、采集公开的人脸检测数据库作为训练和验证的图像数据集；S2、设计基于卷积神经网络的深度学习架构，在深度学习架构内实现人脸检测功能；S3、采集仿生机器孔雀摄像头所拍摄到的现场图像对训练好的卷积神经网网进行微调；S4、根据步骤S3中微调后的深度学习架构进行测试，实现室内复杂环境下的人脸检测功能；S5、根据步骤S4得到的人脸框定位和摄像头距离观众的位置关系，得到经验参数以确定观众的着装定位，并统计各种颜色所占的相应比重。2.如权利要求1所述的图像识别方法，其特征在于，所述步骤S1具体包括以下步骤：S11、人脸检测数据库，选取公开Wider_face数据集和Celeba_face数据集作为人脸检测的训练样本；将图像数据集中原始图像归一化到一个统一的尺寸；Wider_face数据集和Celeba_face数据集中提供了大量的人脸检测数据，并在图中提供了人脸框的位置信息；S12、随机的对人脸图像选取边框，并计算选取边框与真实边框的重复度IOU；S13、将人脸检测数据分为三类，分别是人脸正样本、人脸负样本、人脸部分样本，其占比重为1：3：1；S14、将训练样本生成文件路径，并做好与之对应的标签，标签内容包括正、负样本标签以及随机生成边框和真实边框的偏移值。3.如权利要求2所述的图像识别方法，其特征在于，所述步骤S12中，IOU＞0.65为人脸正样本，IOU＜0.4为人脸负样本；在0.4≤IOU≤0.65之间为人脸部分样本。4.如权利要求1所述的图像识别方法，其特征在于，所述深度学习架构具体如下：深度学习架构由三个卷积神经网络级联组成，三个卷积神经网络分别为第一卷积神经网络PNet，第二卷积神经网络RNet和第三卷积神经网络ONet；第一卷积神经网络PNet在训练阶段的输入尺寸为12*12*3的图像块，第一卷积神经网络PNet为三层全卷积网络，不包含全连接层；第二卷积神经网络RNet输入尺寸为24*24*3的图像块，为四层卷积网路包含三个卷积层和一个全连接层；第三卷积神经网络ONet的输入尺寸48*48*3的图像块；为四层卷积网路包含三个卷积层和一个全连接层；首先将训练样本送入第一卷积神经网络PNet，其输出分别为样本的类别，即人脸正、负样本和人脸定位的预测值；第二卷积神经网络RNet用来细化PNet网络的输出结果；第三卷积神经网络ONet用来细化RNet网络的输出结果，输出分别为样本的类别，人脸定位的预测值和人脸关键点的预测值。5.如权利要求4所述的图像识别方法，其特征在于，所述步骤S3具体包括以下步骤：S31、选取仿生机器孔雀现场所收集到的包括观众和不包括观众的多张图像分为训练样本和测试样本；选取训练样本中的图像取随机框获得人脸正样本、人脸负样本、和人脸部分样本；2CN108038455A权利要求书2/2页S32、将确定好的训练样本和标签送入深度学习架构，对于深度学习架构中三个卷积神经网络的参数进行微调。6.如权利要求5所述的图像识别方法，其特征在于，所述步骤S4具体包括以下步骤：S41、将测试样本送入第一卷积神经网络PNet，获取候选人脸框以及每个人脸对应的四个点坐标；S42、将第一卷积神经网络P

相关资料

基于深度学习的仿生机器孔雀图像识别方法.pdf

本发明公开了基于深度学习的仿生机器孔雀的图像识别方法，包括以下步骤：采集公开的人脸检测数据库作为训练和验证的图像数据集；设计基于卷积神经网络的深度学习架构，在深度学习架构内实现人脸检测功能；采集仿生机器孔雀摄像头所拍摄到的现场图像对训练好的卷积神经网网进行微调，实现室内复杂环境下的人脸检测功能；得到经验参数以确定观众的着装定位，并统计各种颜色所占的相应比重；本发明实现娱乐仿生机器人在复杂环境下准确高效的人脸检测和颜色识别，鲁棒性好；且对现场图像对训练好的深度学习架构进行参数微调；最后实现对于摄像头捕捉到的

2023-12-05

695KB

基于深度学习的植物图像识别方法研究.docx

基于深度学习的植物图像识别方法研究袁银++王东斌++刘永金摘要传统植物图像识别研究主要集中在植物叶片图像。研究将深度神经网络学习运用于植物识别领域，突破局部叶片图像的限制，对常规植物图片进行识别。该方法运用googleNet的深度卷积神经网络结构，通过图像旋转、镜像、随机裁剪等数据预处理方法扩充训练集，再利用SGD（随机梯度下降法）进行模型算法优化，生成对50种常规植物图像的识别模型。结果表明，该模型在测试集上能够达到平均90%的准确率。关键词植物图像识别；深度学习；神经网络TP391.41A1007-5

2024-04-30

30KB

基于深度学习的手势图像分割与识别方法以及装置.pdf

本发明提供了一种基于深度学习的手势图像分割与识别方法以及装置。本发明中方法首先预处理手势图像，使其图像的大小尺寸固定。其次，在复杂背景中通过密集分割网络密集的连接不同空洞率的空洞卷积获取在不同视野上的手势多尺度信息，以提高特征表述的精确性。另外，为了融合不同层级上的细节和空间位置信息，提升整体网络的分割性能，密集分割网络采用编码器‑解码器结构，去掉了冗余的背景信息，实现了手势图像的精准分割。最后将仅仅保留手势图像的掩膜图输入到手势识别网络中，采用改进算法进行识别。通过本发明可以提高手势图像的分割性能，从而

2023-11-06

1.4MB

基于深度学习的家具图像风格识别方法研究的开题报告.docx

基于深度学习的家具图像风格识别方法研究的开题报告一、问题背景家具是人们日常生活中不可或缺的物品，随着社会的发展，人们对家具的要求也越来越高。家具的样式和风格也在不断变化，不同的风格可以体现出不同的文化气息和审美观念。如何快速准确地识别家具的风格，对于家具制造商和消费者都非常重要。定量分析家具的风格特征一直是研究的热点和难点，常用的方法包括手工提取特征、浅层神经网络和传统的机器学习方法。然而，这些方法都存在不同程度的局限性，如手工提取特征需要人工干预和时间成本高、浅层神经网络容易过拟合等。基于深度学习的方法

2024-09-28

11KB

一种基于深度学习的细胞图像识别方法.pdf

本发明属于细胞图像处理技术领域,尤其是一种基于深度学习的细胞图像识别方法,包括视觉图像处理模块,所述视觉图像处理模块将细胞图像分解成n*m个传感器大小的图像,传感器为每个细胞采样赋予0到(2<base:Sup>b</base:Sup>?1)之间的值,所述传感器为每个细胞采样赋予0到(2<base:Sup>b</base:Sup>?1)之间的值为像素值时,使用二维离散矩阵I(n<base:Sub>1</base:Sub>,n<base:Sub>2</base:Sub>)来表示像素值矩阵,像素值矩阵。该基于深

2023-06-06

689KB