预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共17页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN108831437A(43)申请公布日2018.11.16(21)申请号201810622548.8(22)申请日2018.06.15(71)申请人百度在线网络技术(北京)有限公司地址100085北京市海淀区上地十街10号百度大厦三层(72)发明人李昊(74)专利代理机构北京品源专利代理有限公司11332代理人孟金喆(51)Int.Cl.G10L13/02(2013.01)G10H7/00(2006.01)权利要求书2页说明书11页附图3页(54)发明名称一种歌声生成方法、装置、终端和存储介质(57)摘要本发明实施例公开了一种歌声生成方法、装置、终端和存储介质,其中,歌声生成方法包括:获取用户录入的与歌曲对应的语音信号;从预先建立的声学特征模板中获取歌曲对应的标准声学特征信息,根据标准声学特征信息对语音信号进行声学特征信息的更新;其中,声学特征模板中保存有至少一首歌曲的标准声学特征信息;将具有更新后的声学特征信息的语音信号作为目标语音信号进行存储或输出。本发明实施例克服了现有的利用大量的数据进行声学模型训练来实现语音到歌声的转换,且最终形成的歌声中不包含用户自己的声音,导致用户参与度和体验度不高的问题,实现了无需进行声学模型训练,即可实现将用户的语音转换为保留有用户自己的声音的歌声的效果。CN108831437ACN108831437A权利要求书1/2页1.一种歌声生成方法,其特征在于,包括:获取用户录入的与歌曲对应的语音信号;从预先建立的声学特征模板中获取所述歌曲对应的标准声学特征信息,根据所述标准声学特征信息对所述语音信号进行声学特征信息的更新;其中,所述声学特征模板中保存有至少一首歌曲的标准声学特征信息;将具有更新后的声学特征信息的语音信号作为目标语音信号进行存储或输出。2.根据权利要求1所述的方法,其特征在于,根据所述标准声学特征信息对所述语音信号进行声学特征信息的更新,包括:获取所述语音信号对应的音长信息,根据所述音长信息和所述标准声学特征信息对所述语音信号进行时域音频变换,以改变所述语音信号的声学特征信息;相应的,将具有更新后的声学特征信息的语音信号作为目标语音信号进行存储或输出,包括:将进行时域音频变换后得到的语音信号作为目标语音信号进行存储或输出。3.根据权利要求2所述的方法,其特征在于,根据所述音长信息和所述标准声学特征信息对所述语音信号进行时域音频变换,以改变所述语音信号的声学特征信息,包括:根据所述音长信息将所述语音信号进行音元划分,根据所述标准声学特征信息中的标准基频信息、标准音长信息和标准能量信息对音元划分后的所述语音信号进行时域音频变换,以使经时域音频变换后的语音信号的基频信息与所述标准基频信息一致、经时域音频变换后的语音信号的音长信息与所述标准音长信息一致、以及经时域音频变换后的语音信号的能量信息与所述标准能量信息一致。4.根据权利要求1所述的方法,其特征在于,在获取用户录入的与歌曲对应的语音信号之后、根据所述标准声学特征信息对所述语音信号进行声学特征信息的更新之前,还包括:提取所述语音信号的频谱信息;根据所述标准声学特征信息对所述语音信号进行声学特征信息的更新,包括:获取所述语音信号对应的音长信息,根据所述音长信息将所述语音信号进行音元划分;将音元划分后的所述语音信号进行时域到频域的转换,根据所述标准声学特征信息对转换后得到的频域上的语音信号的声学特征信息进行更新;相应的,将具有更新后的声学特征信息的语音信号作为目标语音信号进行存储或输出,包括:根据更新后得到的声学特征信息和所述频谱信息获得目标语音信号,将目标语音信号进行存储或输出。5.根据权利要求4所述的方法,其特征在于,根据所述标准声学特征信息对转换后得到的频域上的语音信号的声学特征信息进行更新,包括:使用所述标准声学特征信息中的标准基频信息替换转换后得到的频域上的语音信号的基频信息,使用所述标准声学特征信息中的标准音长信息替换转换后得到的频域上的语音信号的音长信息,使用所述标准声学特征信息中的标准能量信息替换转换后得到的频域上的语音信号的能量信息。6.根据权利要求4所述的方法,其特征在于,根据更新后得到的声学特征信息和所述频谱信息获得目标语音信号,包括:2CN108831437A权利要求书2/2页将更新后得到的声学特征信息和所述频谱信息输入给声码器,得到所述声码器还原出的目标语音信号。7.根据权利要求2或4所述的方法,其特征在于,获取所述语音信号对应的音长信息,包括:通过语音识别得到所述语音信号中包含的歌词信息,根据所述歌词信息得到所述语音信号对应的音长信息。8.根据权利要求1-6中任一项所述的方法,其特征在于,在获取用户录入的与歌曲对应的语音信号之前还包括:分