预览加载中,请您耐心等待几秒...
1/9
2/9
3/9
4/9
5/9
6/9
7/9
8/9
9/9

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN114387508A(43)申请公布日2022.04.22(21)申请号202111532944.XG06N3/04(2006.01)(22)申请日2021.12.15G06Q50/08(2012.01)G06Q10/10(2012.01)(71)申请人江苏电力信息技术有限公司地址210024江苏省南京市鼓楼区北京西路20号(72)发明人施文波徐然戴华冠(74)专利代理机构南京汇盛专利商标事务所(普通合伙)32238代理人陈扬(51)Int.Cl.G06V20/10(2022.01)G06V10/44(2022.01)G06V10/764(2022.01)G06V10/82(2022.01)G06K9/62(2022.01)权利要求书2页说明书4页附图2页(54)发明名称基于Transformer的安全帽识别方法(57)摘要本发明公开了一种基于Transformer的安全帽识别方法,首先,提取图像上的特征,并加入图像位置信息,其次,在经过Transformer编码组件得到注意力特征信息,并将所得到注意力特征信息和目标查询信息输入Transformer解码组件,输出注意力特征图,最后,利用前馈神经网络预测物体类别和中心坐标、框图高度、宽度。此方法能够用于智慧工地安全帽检测系统,快速有效,方法巧妙,扩展性强,具有良好的应用前景。CN114387508ACN114387508A权利要求书1/2页1.一种基于Transformer的安全帽识别方法,其特征在于,包括以下步骤:步骤1,提取图像上的特征,并加入图像相关位置信息;步骤2,利用Transformer编码组件得到注意力特征信息;步骤3,将所得到注意力特征信息和目标查询信息输入Transformer解码组件,输出注意力特征图;步骤4,注意力特征图当成输入,利用前馈神经网络预测物体类别和中心坐标、框图高度、宽度。2.根据权利要求1所述的基于Transformer的安全帽识别方法,其特征在于,所述步骤1包括以下步骤:步骤1‑1,将图像上的三维信息通过卷积神经网络转换成二维图像信息其中H0为图像高,W0为图像宽,d=512;步骤1‑2,通过正弦函数和余弦函数将位置信息嵌入到图像中,具体的公式如下:其中,pos表示当前位置,i表示为维度,dmodel为HW。3.根据权利要求1所述的基于Transformer的安全帽识别方法,其特征在于,所述步骤2包括以下步骤:步骤2‑1,将输入信息,通过多头自注意力模块,得到多头自注意力特征信息;步骤2‑2,进一步地,对所得信息数据用Softmax归一化,再做残差连接和标准化,具体地公式如下:其中xi为第i个节点的输出值,j为输出节点个数;步骤2‑3,通过前馈神经网络,更深地挖掘注意力重点信息,并对结果归一化和残差连接;步骤2‑4,重复6次步骤2‑1至2‑3,得到Transformer编码组件最终输出。4.根据权利要求3所述的基于Transformer的安全帽识别方法,其特征在于,所述步骤2‑1包括以下步骤:步骤2‑1‑1,在上述得到多头自注意力特征图,是将多头注意力应用于图像信息特征,具体计算公式如下:oMultiHead(Q,K,V)=Concat(head1,...,headh)W2CN114387508A权利要求书2/2页其中5.根据权利要求1所述的基于Transformer的安全帽识别方法,其特征在于,所述步骤3包括以下步骤:步骤3‑1,Transformer编码组件输出注意力特征信息成为Transformer解码组件多头注意力中的V,K输入,目标查询信息作为Q的输入,通过多头注意力模块,得到多头自注意力特征信息,对所得信息数据用Softmax归一化,做残差连接,再通过前馈神经网络,并对结果归一化和残差连接,得到第一次输出注意力特征信息;步骤3‑2,重复6次步骤3‑1,其中每一次V,K输入都来自Transformer编码组件输出注意力特征信息,Q由每一步骤中上一步骤的输出注意力特征信息,最终得到注意力特征图。6.根据权利要求1所述的基于Transformer的安全帽识别方法,其特征在于,所述步骤4包括:对自注意力特征图做前馈神经网络,分别输出识别目标类别和目标边框位置。3CN114387508A说明书1/4页基于Transformer的安全帽识别方法技术领域[0001]本发明涉及图像目标识别技术领域,尤其涉及一种基于Transformer的安全帽识别方法。背景技术[0002]智慧工地是一种崭新的工程全生命周期管理理念,它利用人工智能、计算机视觉等技术实现对工程项目实施过程的高效管理,大幅度地降低施工环境下出现的意外和损失,提高施工安全性,让施工工程管理更加省心。在工地施