视频动作识别模型的训练方法、装置、计算设备及存储介质-豆柴文库

视频动作识别模型的训练方法、装置、计算设备及存储介质.pdf

2023-05-26

10金币

709KB

16页

听容****55

实名认证

内容提供者

1/10

2/10

3/10

4/10

5/10

6/10

7/10

8/10

9/10

10/10

亲，该文档总共16页，到这已经超出免费预览范围，如果喜欢就直接下载吧～

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

相关资料

视频动作识别模型的训练方法、装置、计算设备及存储介质.pdf

本发明公开一种视频动作识别模型的训练方法、装置、计算设备及存储介质,该方法包括:按预设的采样策略对样本视频进行采样,得到至少两个图片序列,每个所述图片序列包括从所述样本视频采集的按时序排列的多帧图片;通过R(2+1)D网络对所述图片序列进行特征提取,得到所述样本视频的视频序列特征;将所述视频序列特征输入多标签分类模块进行处理得到视频动作分类结果,并基于所述视频动作分类结果计算损失函数;根据所述损失函数的计算结果调整所述R(2+1)D网络和多标签分类模块,得到目标视频动作识别模型。根据本发明实施例可以有效解

2023-05-26

709KB

语音识别模型的训练方法、装置、设备及存储介质.pdf

本申请实施例提供一种语音识别模型的训练方法、装置、设备及存储介质，获取多个样本语音数据；根据关键词对应的声学特征中的信号帧进行建模，得到初始声学模型，每个声学特征包含多个信号帧；利用多个样本语音数据对初始声学模型进行训练，得到目标声学模型；根据目标声学模型构建语音识别模型。本申请通过关键词对应的帧级别的声学特征来构建声学模型，无需对样本语音数据进行对齐处理，训练过程相对简单，可以提升训练效率。

2023-07-25

933KB

语音识别模型的训练方法、装置、设备及存储介质.pdf

本申请公开了一种语音识别模型的训练方法、装置、设备及存储介质,属于人工智能领域。所述方法包括:获取样本音频集,所述样本音频集中包括多个样本音频;基于初始语音识别模型,在所述样本音频集中筛选候选样本音频;在所述候选样本音频中提取音频片段;其中,所述音频片段包括所述候选样本音频中与连续相同文本单元对齐的音频;且,所述初始语音识别模型在对所述候选样本音频进行语音识别时,未正确识别所述连续相同文本单元;根据所述音频片段对所述初始语音识别模型进行再训练,得到目标语音识别模型。本申请能够提升语音识别质量,特别是提升了

2023-04-20

724KB

小样本动作识别模型训练方法、装置、电子设备及存储介质.pdf

本发明提供了一种小样本动作识别模型训练方法、装置、电子设备以及存储介质，方法包括：对第二训练样本集合进行处理，得到第一视频帧序列；对查询视频进行处理，得到第二视频帧序列；对第一视频帧序列进行处理，得到第一时序关系描述子；对第二视频帧序列进行处理，得到第二时序关系描述子；根据第一时序关系描述子和第二时序关系描述子，对小样本动作识别模型的模型参数进行调整，以实现通过小样本动作识别模型对视频信息中的动作进行识别，由此，经过训练的小样本动作识别模型可以实现鲁棒并精确地对视频中的目标对象的动作进行准确地识别，可以增

2023-07-24

1.4MB

行人重识别模型的训练方法、装置、计算设备及存储介质.pdf

本发明公开一种行人重识别模型的训练方法、装置、计算设备及存储介质，该方法包括：获取第一行人重识别训练数据集所述第一行人重识别训练数据集输入预设的行人重识别模型进行处理，并基于处理结果得到第一损失函数所述第一行人重识别训练数据集进行处理得到第二行人重识别训练数据集所述第二行人重识别训练数据集输入远程监督网络进行处理，并根据处理结果得到第二损失函数；所述第一损失函数和第二损失函数所述预设的行人重识别模型，得到目标行人重识别模型。根据本发明实施例通过增加监督网络提供监督信息来实现不增加识别网络复杂度的前提下，扩

2023-07-24

700KB