一种说话人音频分离方法、终端设备及存储介质.pdf
Ma****57
在线预览结束,喜欢就下载吧,查找使用更方便
相关资料
一种说话人音频分离方法、终端设备及存储介质.pdf
本发明涉及一种说话人音频分离方法、终端设备及存储介质,该方法中包括:S1:将包含多个说话人语音的音频按预设时长切分为多个音频片段;S2:提取各音频片段中的声纹向量;S3:将所有音频片段的声纹向量拼接为一个声纹特征矩阵;S4:根据声纹特征矩阵,计算音频片段的相似度矩阵;S5:根据相似度矩阵,对各音频片段进行聚类;S6:根据聚类结果,设定每个类别对应一个说话人,将每个类别对应的所有音频片段进行拼接,完成对不同说话人音频的分离。本发明可以在未知说话人人数的情况下,实现说话人音频的分离,具有较高的准确性,能够应用
音频播放方法、装置、终端设备及存储介质.pdf
本申请实施例提供了一种音频播放方法、装置、终端设备及存储介质,涉及音频播放技术领域。所述方法包括:显示在音频播放界面,音频播放界面包括中显示合集播放区域和合集展示区域,合集播放区域用于展示中显示有正在播放的第一音频合集的标识,合集展示区域用于展示中显示有多个音频合集的合集标识,每个音频合集中包括至少一个音频;基于合集移动滑动指令,将合集展示区域中的第二目标音频合集的合集标识滑动移动到合集播放区域中;播放第二目标音频合集中的音频。本申请实施例提供的技术方案,能够提升播放多个音频合集时的操作便捷性。
音频播放方法、装置、终端设备及存储介质.pdf
本申请实施例提供了一种音频播放方法、装置、终端设备及存储介质,涉及应用程序开发和音频技术领域。所述方法包括:显示目标音频的播放界面,目标音频是包含多个音轨的音频;在播放界面中显示多个音轨组合分别对应的标识信息,其中,每个音轨组合中包含有多个音轨中的至少一个音轨,音轨组合对应的标识信息中,显示有音轨组合包含的各个音轨的标识信息;响应于针对多个音轨组合中的目标音轨组合对应的标识信息的操作,在目标音轨组合中包含多个音轨的情况下,播放目标音轨组合对应的音频,目标音轨组合对应的音频是对目标音轨组合中包含的多个音轨的
音频播放方法、装置、终端设备及存储介质.pdf
本申请实施例提供了一种音频播放方法、装置、终端设备及存储介质,涉及应用程序开发和音频技术领域。所述方法包括:显示目标音频的播放界面,播放界面中显示有目标音频包含的多个音轨;响应于针对多个音轨中的至少一个音轨的调节操作,对至少一个音轨的播放参数进行调节,得到调节后的至少一个音轨;对目标音频的多个待合成音轨进行混音,得到更新后的目标音频;其中,多个待合成音轨包括调节后的至少一个音轨;播放更新后的目标音频。采用本申请实施例提供的技术方案,能够提升音频调节的灵活性。
音频场景分类方法、装置、终端设备及存储介质.pdf
本申请适用于计算机技术领域,提供了一种音频场景分类方法、装置、终端设备及存储介质,该方法包括:采集目标场景下第一预设时长的音频数据,得到第一音频片段;提取第一音频片段的第一特征信息和第二特征信息,其中,第一特征信息表示以时间为基准的频率特征信息,第二特征信息表示以频率为基准的时间特征信息;按照预设规则分别将第一特征信息划分为N个第一特征片段、将第二特征信息划分为N个第二特征片段,得到N个特征组,其中,每个特征组中包括一个第一特征片段和一个第二特征片段;计算N个特征组各自的融合特征;根据N个特征组各自的融合