预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共14页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN107704534A(43)申请公布日2018.02.16(21)申请号201710862220.9(22)申请日2017.09.21(71)申请人咪咕音乐有限公司地址610000四川省成都市高新区府城大道西段399号6栋1单元12层3号(72)发明人黄玉贵(74)专利代理机构北京派特恩知识产权代理有限公司11270代理人张振伟姚开丽(51)Int.Cl.G06F17/30(2006.01)G06F17/28(2006.01)权利要求书2页说明书7页附图4页(54)发明名称一种音频转换方法及装置(57)摘要本发明公开了一种音频转化方法,包括:获取第一音频数据以及转换目标,确定出所述第一音频数据的音节所对应的文本信息以及所述第一音频数据的音频特征,并确定出所述转换目标的发音方式;在设定的发音数据库查询出所述第一音频数据的文本信息所对应于所述转换目标发音方式的发音数据,根据所述文本信息的文字顺序将所述发音数据进行合成,获得第二音频数据;按照所述第一音频数据的音频特征,对所述第二音频数据的音频特征进行调音,确定出调音后的第二音频数据。本发明还公开了一种音频转化装置以及计算机可读存储介质。CN107704534ACN107704534A权利要求书1/2页1.一种音频转换方法,其特征在于,所述方法包括:获取第一音频数据以及转换目标,确定出所述第一音频数据的音节所对应的文本信息以及所述第一音频数据的音频特征,并确定出所述转换目标的发音方式;在设定的发音数据库查询出所述第一音频数据的文本信息所对应于所述转换目标发音方式的发音数据,根据所述文本信息的文字顺序将所述发音数据进行合成,获得第二音频数据;按照所述第一音频数据的音频特征,对所述第二音频数据的音频特征进行调音,确定出调音后的第二音频数据。2.根据权利要求1所述的方法,其特征在于,所述获取第一音频数据,确定出所述第一音频数据的音频特征,包括:对所述第一音频数据连续的音节进行采样,确定出所述第一音频数据的音频特征,其中,所述音频特征包括所述音频数据的响度、音色以及音调。3.根据权利要求1所述的方法,其特征在于,所述方法还包括:采集单个文字不同发音方式的音频数据,生成发音数据库;其中,所述发音方式至少包括各个区域不同性别的发音方式;所述发音数据库还包含所述文字所对应的不同发音方式的音频数据在数据库中存储位置的索引信息。4.根据权利要求1所述的方法,其特征在于,所述按照所述第一音频数据的音频特征,对所述第二音频数据的音频特征进行调整,包括:根据所述第一音频数据对应文字的音节的响度对所述第二音频数据对应文字的发音音节的响度进行调音;根据所述第一音频数据对应文字的音节的音色对所述第二音频数据对应文字的发音音节的音色进行调音;根据所述第一音频数据对应文字的音节的音调对所述第二音频数据对应文字的发音音节的音调进行调音。5.一种音频转换装置,其特征在于,所述装置包括:采集模块,用于获取第一音频数据以及转换目标,确定出所述第一音频数据的音节所对应的文本信息以及所述第一音频数据的音频特征,并确定出所述转换目标的发音方式;转换模块,用于在设定的发音数据库查询出所述第一音频数据的文本信息所对应于所述转换目标发音方式的发音数据,根据所述文本信息的文字顺序将所述发音数据进行合成,获得第二音频数据;调音模块,用于按照所述第一音频数据的音频特征,对所述第二音频数据的音频特征进行调音,确定出调音后的第二音频数据。6.根据权利要求5所述的装置,其特征在于,所述第一采集模块具体用于:对所述第一音频数据连续的音节进行采样,确定出所述第一音频数据的音频特征,其中,所述音频特征包括所述音频数据的响度、音色以及音调。7.根据权利要求6所述的装置,其特征在于,所述装置还包括:存储器,用于采集单个文字不同发音方式的音频数据,生成发音数据库;其中,所述发音方式至少包括各个区域不同性别的发音方式;所述发音数据库还包含所述文字所对应的不同发音方式的音频数据在数据库中存储位置的索引信息。2CN107704534A权利要求书2/2页8.根据权利要求6所述的装置,其特征在于,所述调音模块,具体用于:根据所述第一音频数据对应文字的音节的响度对所述第二音频数据对应文字的发音音节的响度进行调音;根据所述第一音频数据对应文字的音节的音色对所述第二音频数据对应文字的发音音节的音色进行调音;根据所述第一音频数据对应文字的音节的音调对所述第二音频数据对应文字的发音音节的音调进行调音。9.一种终端,其特征在于,包括:处理器和用于存储能够在处理器上运行的计算机程序的存储器,其中,所述处理器用于运行所述计算机程序时,执行权利要求1至5任一所述方法的步骤。10.一种计算机可读存储介质,其上存储