预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共23页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN110335629A(43)申请公布日2019.10.15(21)申请号201910578513.3(22)申请日2019.06.28(71)申请人腾讯音乐娱乐科技(深圳)有限公司地址518000广东省深圳市前海深港合作区前湾一路1号A栋201室(72)发明人黄安麒李深远董治(74)专利代理机构深圳翼盛智成知识产权事务所(普通合伙)44300代理人黄威(51)Int.Cl.G10L25/90(2013.01)G10L15/26(2006.01)G06F16/68(2019.01)权利要求书3页说明书14页附图5页(54)发明名称音频文件的音高识别方法、装置以及存储介质(57)摘要本发明实施例公开了一种音频文件的音高识别方法、装置以及存储介质;本发明实施例通过获取音频文件,音频文件包括音频数据,然后,从音频文本中提取预设时间点对应的文字,得到多个音频单字,紧接着,获取音频单字的在音频文本中的音高独立概率,再然后,根据多个音频标签,获取音频单字在所述音频文本中的音高变化概率,最后,对音高独立概率以及音高变化概率进行处理,得到音频文件的音高结果。相对于现有的方案而言,可以避免识别的音高存在与音频文本不对应或音高漏识别的情况发生,因此,可以提高音高识别结果的准确率。CN110335629ACN110335629A权利要求书1/3页1.一种音频文件的音高识别方法,其特征在于,包括:获取音频文件,所述音频文件包括音频数据,音频数据对应的音频文本以及所述音频数据的多个音频标签;从所述音频文本中提取预设时间点对应的文字,得到多个音频单字,所述时间点为在所述音频文件中根据预设时间间隔对应的时间点;获取所述音频单字的在所述音频文本中的音高独立概率;根据多个所述音频标签,获取所述音频单字在所述音频文本中的音高变化概率;对所述音高独立概率以及音高变化概率进行处理,得到所述音频文件的音高结果。2.根据权利要求1所述的音高识别方法,其特征在于,所述根据多个所述音频标签,获取所述音频单字在所述音频文本中的音高变化概率,包括:获取每个所述音频单字在预设时间点的变化参数,得到多个变化参数;提取每个所述音频单字的音高值,得到多个音高值;基于多个变化参数、多个音频标签以及多个音高值,计算每个所述音高值在相邻预设时间间隔发生变化的概率,得到每个所述音高值对应的音高变化概率。3.根据权利要求2所述的音高识别方法,其特征在于,所述基于多个变化参数、多个音频标签以及多个音高值,计算每个所述音高值在相邻预设时间间隔发生变化的概率,得到每个所述音高值对应的音高变化概率,包括:计算每个音高值在相邻预设时间间隔的差值,得到多个音高变化值;基于多个变化参数、多个音频标签以及多个音高变化值,确定每个所述音高值对应的音高变化概率。4.根据权利要求3所述的音高识别方法,其特征在于,所述音频标签包括语种标签和曲风标签,所述基于多个音频标签、多个变化参数以及多个音高变化值,确定每个所述音高值对应的音高变化概率,包括:将相同预设时间点的变化参数、音高变化值以及语种标签作为一组同源组,得到多组第一同源组;将相同预设时间点的变化参数以及语种标签作为一组同源组,得到多组第二同源组;将相同预设时间点的变化参数、音高变化值以及曲风标签作为一组同源组,得到多组第三同源组;将相同预设时间点的变化参数以及曲风标签作为一组同源组,得到多组第四同源组;根据所述第一同源组、第二同源组、第三同源组以及第四同源组,确定每个所述音高值的变化概率。5.根据权利要求4所述的音高识别方法,其特征在于,所述根据所述第一同源组、第二同源组、第三同源组以及第四同源组,确定每个所述音高值的变化概率,包括:根据多组第一同源组以及多组第二同源组,计算每个音高变化值在每个第二同源组出现的概率,得到多个第一概率;根据多组第三同源组以及多组第四同源组,计算每个音高变化值在每个第四同源组出现的概率,得到多个第二概率;计算所述第一概率与相应的第二概率之间的平均值,得到每个所述音高值的变化概率。2CN110335629A权利要求书2/3页6.根据权利要求1至5任一项所述的音高识别方法,其特征在于,所述获取所述音频单字的在所述音频文本中的音高独立概率,包括:统计所述音频单字在所述音频文本出现的单字次数以及所述音频单字对应的音高值在所述音频文本出现的音高次数;计算所述单字次数与音高次数之间的乘积,确定每个音频单字的在所述音频文本中的音高独立概率。7.根据权利要求1至5任一项所述的音高识别方法,其特征在于,所述对所述音高独立概率以及音高变化概率进行处理,得到所述音频文件的音高结果,包括:确定当前需要处理的音高变化概率;计算当前需要处理的音高变化概率与每个音高独立概率的和,得到多个