预览加载中,请您耐心等待几秒...
1/7
2/7
3/7
4/7
5/7
6/7
7/7

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

本发明涉及一种说话人音频分离方法、终端设备及存储介质,该方法中包括:S1:将包含多个说话人语音的音频按预设时长切分为多个音频片段;S2:提取各音频片段中的声纹向量;S3:将所有音频片段的声纹向量拼接为一个声纹特征矩阵;S4:根据声纹特征矩阵,计算音频片段的相似度矩阵;S5:根据相似度矩阵,对各音频片段进行聚类;S6:根据聚类结果,设定每个类别对应一个说话人,将每个类别对应的所有音频片段进行拼接,完成对不同说话人音频的分离。本发明可以在未知说话人人数的情况下,实现说话人音频的分离,具有较高的准确性,能够应用于多个场景,具有很高的泛化能力。