一种基于多模态的音乐分类方法、系统及存储介质.pdf
一吃****新冬
在线预览结束,喜欢就下载吧,查找使用更方便
相关资料
一种基于多模态的音乐分类方法、系统及存储介质.pdf
本发明公开了一种基于多模态的音乐分类方法、系统及存储介质,涉及音乐分析技术领域,本发明首先从目标音乐中获取音频数据和歌词数据,进而获取词向量、音频高层特征、乐器种类等数据,同时结合权重信息,得到第一权重统计值、第二权重统计值、第三权重统计值,将所述各个统计值进行归一化处理和分类求和,得到第四权重统计值,依据所述第四权重统计值,即可得到目标音乐的分类结果。本发明采用基于词向量、音频高层特征、乐器种类的多模态分类方法,综合考虑目标音乐中的各种因素和所占权重,最终得到了更加准确的分类结果。
一种基于多模态的情感分类方法、装置、设备及存储介质.pdf
本发明适用于人工智能技术领域,尤其涉及一种基于多模态的情感分类方法、装置、设备及存储介质,提取语音信息中的语音特征与文本特征,得到语音信息对应的语音特征序列与语音信息对应的文本特征序列,使用预设双向长短期记忆模型得到语音隐藏特征序列与文本隐藏特征序列,计算得到目标特征序列,与文本隐藏特征序列中的对应特征进行特征融合,将融合特征输入至全连接层,得到语音信息的情感分类结果,对语音特征序列与文本特征序列进行交互处理,得到语音特征序列与文本特征序列中对应特征的注意力权值,通过注意力权值增加语音特征与文本特征之间的
基于多模态表示的视频分类方法、装置和设备及存储介质.pdf
本申请公开了一种基于多模态表示的视频分类方法、装置和设备及存储介质,涉及人工智能技术领域,用于降低模型学习的难度,提升模型训练效率。该方法包括:将目标视频的各个模态的数据信息输入至已训练的目标多模态视频表示模型;获得目标多模态视频表示模型输出的目标视频在目标业务场景的视频业务类别;其中,目标多模态视频表示模型是基于各个模态各自对应的基础视频数据样本集合进行视频域的适应性预训练,并基于目标业务场景中各个模态各自对应的视频业务数据样本集合进行再训练获得的,每一基础视频数据样本集合包括各个视频对应于同一模态的基
一种基于多模态学习的音乐情感分类方法.pdf
本发明公开了一种基于多模态学习的音乐情感分类方法,包含以下步骤:数据预处理,根据所需模态信息对音乐的音频、歌词、评论分别进行预处理来获取模型的有效输入;表示学习,将每个模态使用不同的建模方式分别映射到各自的表示空间;特征提取,提取不同模态的模型映射后的特征向量,并降维至同一维度;多模态融合,将三种不同模态的特征进行级联早融合,从而建立更全面的特征表示;情感分类决策,使用融合后的特征对音乐进行有监督的情感分类。本发明的音乐情感分类方法,提供了一种基于多模态联合学习的方法,可以有效的减少目前主流的单模态模型方
一种基于多模态融合的肿瘤分类方法及系统.pdf
本发明提出一种基于多模态融合的肿瘤分类方法和系统,包括:根据来自同一位用户的多模态影像构建多模态图,多模态图中顶点为该多模态影像中单帧影像,多模态图中边为模态相异的顶点间的匹配边;使用肿瘤分类模型对多模态图中所有匹配边进行特征的提取和融合,得到每条边的置信度;根据每条边的置信度,选择并构建出一个可信边集合,将可信边集的置信度和该用户的临床信息进行加权融合,得到该多模态影像建图的肿瘤识别结果。由此能够结合用户不同模态的影像数据,进行肿瘤高精度分类。