一种基于混合注意力机制的端到端单目标跟踪方法及装置.pdf
美丽****ka
在线预览结束,喜欢就下载吧,查找使用更方便
相关资料
一种基于混合注意力机制的端到端单目标跟踪方法及装置.pdf
一种基于混合注意力机制的端到端单目标跟踪方法,构建一个基于Transformer跟踪的跟踪框架MixFormer,用于目标跟踪,跟踪框架的构建包括以下步骤:1)数据准备阶段;2)网络配置阶段;3)离线训练阶段;4)在线跟踪阶段。本发明采用了基于混合注意力的骨干网络来同时进行特征提取与目标信息融合,得到了一个简洁清晰的跟踪框架,并且能有效地提升性能。此外,本发明的跟踪方法能对跟踪过程中的物体变形有更好的适应能力,有效地提升目标回归的精度。
基于注意力机制的联合监督端到端说话人识别模型.docx
基于注意力机制的联合监督端到端说话人识别模型随着智能语音助手技术的发展,说话人识别成为了一个备受关注的技术领域。说话人识别可以在不需要输入标签或说话人信息的情况下自动识别说话人身份。这在实际应用中具有广泛的应用前景,如会议识别、情感分析、人机交互、智能客服等。基于注意力机制的联合监督端到端说话人识别模型采用的是深度学习技术,其主要优势在于提高了说话人识别的准确性,并且能够自动学习模型。基于注意力机制的联合监督端到端说话人识别模型通过CNN(卷积神经网络)和BLSTM(双向长短时记忆网络)提取语音特征。在最
一种多视角注意力机制的端到端自动驾驶行为决策方法.pdf
本发明公开了一种多视角注意力机制端到端自动驾驶行为决策方法,属于自动驾驶技术领域。该方法基于多摄像头获取的视频流信息,得到各视角的多时刻场景图像;将其分别降维后得到各视角特征,通过多视角注意力网络模块提取出各视角特征融合了其它视角不同事物的权重信息,再将该权重信息作用回原输入,得到各视角的融合特征;再分别经过池化处理后输入长短时记忆网络,获取各视角的时序特征;最后结合实时导航信息,预测车辆的转角控制量和速度控制量,作为最终的决策信息。本发明基于多视角注意力,综合各个视觉传感器提取车身周围目标位置信息和时间
一种基于移动端的车端目标检测方法及装置.pdf
本发明涉及一种基于移动端的车端目标检测方法及装置。本发明首先获取并标注车端感知的目标图像数据;然后,训练yolov5s网络模型,得到目标检测模型;将所述目标检测模型进行格式转换,并载入移动端;最后,实时获取车端感知的图像数据,并发送至移动端,移动端利用目标检测模型进行车端图像检测并输出检测结果。通过本技术方案,使得在安卓移动端可以实现车端目标检测,弥补了车端目标检测算法便捷性的不足。
基于端到端模型的混合语音识别系统及方法.pdf
本发明涉及一种基于端到端模型的混合语音识别系统及方法,包括特征提取模块、语言模型、基于端到端模型的声学模型、解码器、词图重估模块以及输出模块。本发明采用声学语言端到端建模技术,对海量语音数据进行建模,并将端到端模型的编码网络作为声学模型,嵌入到混合语音识别系统中,不仅进一步提高了语音识别准确率,而且解决了纯端到端语音识别系统在项目中难以做定制化的问题。另外,本发明在端到端模型的编码网络的基础上,继续做鉴别性声学模型训练(SMBR、MPE等),可以进一步提高识别准确率。