一种基于多模态的音乐分类方法、系统及存储介质-豆柴文库

一种基于多模态的音乐分类方法、系统及存储介质.pdf

2023-07-24

10金币

438KB

10页

一吃****新冬

实名认证

内容提供者

1/10

2/10

3/10

4/10

5/10

6/10

7/10

8/10

9/10

10/10

在线预览结束，喜欢就下载吧，查找使用更方便

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN114117118A(43)申请公布日2022.03.01(21)申请号202111448144.X(22)申请日2021.11.30(71)申请人淄博职业学院地址255300山东省淄博市周村区联通路506号(72)发明人刘向丽(74)专利代理机构北京睿智保诚专利代理事务所(普通合伙)11732代理人韩迎之(51)Int.Cl.G06F16/65(2019.01)G06F16/683(2019.01)G06K9/62(2022.01)G06N3/04(2006.01)权利要求书2页说明书5页附图2页(54)发明名称一种基于多模态的音乐分类方法、系统及存储介质(57)摘要本发明公开了一种基于多模态的音乐分类方法、系统及存储介质，涉及音乐分析技术领域，本发明首先从目标音乐中获取音频数据和歌词数据，进而获取词向量、音频高层特征、乐器种类等数据，同时结合权重信息，得到第一权重统计值、第二权重统计值、第三权重统计值，将所述各个统计值进行归一化处理和分类求和，得到第四权重统计值，依据所述第四权重统计值，即可得到目标音乐的分类结果。本发明采用基于词向量、音频高层特征、乐器种类的多模态分类方法，综合考虑目标音乐中的各种因素和所占权重，最终得到了更加准确的分类结果。CN114117118ACN114117118A权利要求书1/2页1.一种基于多模态的音乐分类方法，其特征在于，包括以下步骤：步骤1、获取目标音乐的音频数据和歌词数据；步骤2、依据所述歌词数据，获取第一权重统计值；步骤2.1、对所述歌词数据进行分词，得到歌词数据中的词向量；步骤2.2、使用循环神经网络，基于自注意力机制和上下文语境，确定词向量的权重；步骤2.3、使用分类器获取词向量的情感类别；步骤2.4、依据词向量的权重和情感类别，对相同情感类别的词向量权重进行求和，得到基于词向量的不同情感类别的权重统计值，作为第一权重统计值；步骤3、依据所述音频数据，获取第二权重统计值；步骤3.1、对所述音频数据进行音频高层特征提取；步骤3.2、将音频高层特征输入随机森林分类器，依据决策树得到的不同情感类别结果节点个数作为不同情感类别的权重，即得到基于音频高层特征的不同情感类别的权重统计值，作为第二权重统计值；步骤4、依据所述音频数据，获取第三权重统计值；步骤4.1、对所述音频数据进行乐器识别；步骤4.2、获取乐器对应的情感类别；步骤4.3、获取乐器弹奏的持续时间，作为乐器的权重；步骤4.4、依据乐器的权重和情感类别，得到基于乐器的不同情感类别的权重统计值，作为第三权重统计值；步骤5、分别对所述第一权重统计值、所述第二权重统计值、所述第三权重统计值进行归一化；步骤6、将归一化后的第一权重统计值、第二权重统计值、第三权重统计值中相同情感类别的权值进行求和，得到第四权重统计值；步骤7、依据所述第四权重统计值，得到目标音乐的分类结果。2.根据权利要求1所述的一种基于多模态的音乐分类方法，其特征在于，所述步骤2.2中，使用循环神经网络学习词向量的上下文信息，并结合自注意力机制，获取词向量的权重。3.根据权利要求1所述的一种基于多模态的音乐分类方法，其特征在于，所述步骤2.3中，使用分类器之前，对分类器进行训练，具体步骤为：获取不同音乐中歌词数据的词向量，并为词向量设置情感标签；使用带有情感标签的词向量训练分类器。4.根据权利要求1所述的一种基于多模态的音乐分类方法，其特征在于，所述分类器为SVM分类器或CNN分类器。5.根据权利要求1所述的一种基于多模态的音乐分类方法，其特征在于，所述步骤4.1中，基于所述音频数据的音高特征矩阵和基于音色的常数Q变换矩阵，识别乐器种类。6.根据权利要求1所述的一种基于多模态的音乐分类方法，其特征在于，所述步骤4.2中，从预设的乐器库中获取乐器对应的情感类别；所述乐器库中包括每种乐器所对应的情感类别。7.根据权利要求1所述的一种基于多模态的音乐分类方法，其特征在于，所述步骤7中，2CN114117118A权利要求书2/2页依据所述第四权重统计值，得到目标音乐的一个或多个分类结果。8.一种基于多模态的音乐分类系统，其特征在于，包括：数据提取模块，用于获取目标音乐的音频数据和歌词数据；第一权重统计值获取模块，用于依据所述歌词数据，获取第一权重统计值；第二权重统计值获取模块，用于依据所述音频数据，获取第二权重统计值；第三权重统计值获取模块，用于依据所述音频数据，获取第三权重统计值；归一化模块，用于分别对所述第一权重统计值、所述第二权重统计值、所述第三权重统计值进行归一化；第四权重统计值获取模块，用于将归一化后的第一权重统计值、第二权重统计值、第三权重统计值中相同情感类别的权值进行求和，得到第四权重统计值

相关资料

一种基于多模态的音乐分类方法、系统及存储介质.pdf

本发明公开了一种基于多模态的音乐分类方法、系统及存储介质，涉及音乐分析技术领域，本发明首先从目标音乐中获取音频数据和歌词数据，进而获取词向量、音频高层特征、乐器种类等数据，同时结合权重信息，得到第一权重统计值、第二权重统计值、第三权重统计值，将所述各个统计值进行归一化处理和分类求和，得到第四权重统计值，依据所述第四权重统计值，即可得到目标音乐的分类结果。本发明采用基于词向量、音频高层特征、乐器种类的多模态分类方法，综合考虑目标音乐中的各种因素和所占权重，最终得到了更加准确的分类结果。

2023-07-24

438KB

一种基于多模态的情感分类方法、装置、设备及存储介质.pdf

本发明适用于人工智能技术领域，尤其涉及一种基于多模态的情感分类方法、装置、设备及存储介质，提取语音信息中的语音特征与文本特征，得到语音信息对应的语音特征序列与语音信息对应的文本特征序列，使用预设双向长短期记忆模型得到语音隐藏特征序列与文本隐藏特征序列，计算得到目标特征序列，与文本隐藏特征序列中的对应特征进行特征融合，将融合特征输入至全连接层，得到语音信息的情感分类结果，对语音特征序列与文本特征序列进行交互处理，得到语音特征序列与文本特征序列中对应特征的注意力权值，通过注意力权值增加语音特征与文本特征之间的

2023-07-21

530KB

基于多模态表示的视频分类方法、装置和设备及存储介质.pdf

本申请公开了一种基于多模态表示的视频分类方法、装置和设备及存储介质，涉及人工智能技术领域，用于降低模型学习的难度，提升模型训练效率。该方法包括：将目标视频的各个模态的数据信息输入至已训练的目标多模态视频表示模型；获得目标多模态视频表示模型输出的目标视频在目标业务场景的视频业务类别；其中，目标多模态视频表示模型是基于各个模态各自对应的基础视频数据样本集合进行视频域的适应性预训练，并基于目标业务场景中各个模态各自对应的视频业务数据样本集合进行再训练获得的，每一基础视频数据样本集合包括各个视频对应于同一模态的基

2023-07-25

1.5MB

一种基于多模态学习的音乐情感分类方法.pdf

本发明公开了一种基于多模态学习的音乐情感分类方法，包含以下步骤：数据预处理，根据所需模态信息对音乐的音频、歌词、评论分别进行预处理来获取模型的有效输入；表示学习，将每个模态使用不同的建模方式分别映射到各自的表示空间；特征提取，提取不同模态的模型映射后的特征向量，并降维至同一维度；多模态融合，将三种不同模态的特征进行级联早融合，从而建立更全面的特征表示；情感分类决策，使用融合后的特征对音乐进行有监督的情感分类。本发明的音乐情感分类方法，提供了一种基于多模态联合学习的方法，可以有效的减少目前主流的单模态模型方

2023-12-03

549KB

一种基于多模态融合的肿瘤分类方法及系统.pdf

本发明提出一种基于多模态融合的肿瘤分类方法和系统,包括:根据来自同一位用户的多模态影像构建多模态图,多模态图中顶点为该多模态影像中单帧影像,多模态图中边为模态相异的顶点间的匹配边;使用肿瘤分类模型对多模态图中所有匹配边进行特征的提取和融合,得到每条边的置信度;根据每条边的置信度,选择并构建出一个可信边集合,将可信边集的置信度和该用户的临床信息进行加权融合,得到该多模态影像建图的肿瘤识别结果。由此能够结合用户不同模态的影像数据,进行肿瘤高精度分类。

2023-05-25

526KB