拼接语音生成方法、装置、电子设备及存储介质.pdf
霞英****娘子
亲,该文档总共17页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
拼接语音生成方法、装置、电子设备及存储介质.pdf
本申请提供一种拼接语音生成方法、装置、电子设备及存储介质。涉及语音识别技术领域。所述方法包括:获取用户输入的待合成文本;根据所述待合成文本和语音单元数据库,通过拼接语音合成系统进行处理,获得所述待合成文本对应的合成语音数据;其中,所述语音单元数据库包括通过对预先获取的标准语音和标准文本进行对齐后得到的对齐语料数据。以上方案,通过拼接语音合成系统对待合成文本进行处理,基于语音单元数据库,合成语音数据,从而省去录制语音的时间,保留语音单元数据库中说话人的音质,实现高效生成语音。
语音生成方法及装置、存储介质、电子设备.pdf
本公开属于语音处理技术领域,涉及一种语音生成方法及装置、存储介质、电子设备。该方法包括:获取待处理语音的语音特征向量,并将语音特征向量输入至语音生成模型得到语言单元向量;获取文本特征向量,并根据文本特征向量和语言单元向量确定待处理特征向量;将待处理特征向量输入至序列到序列模型中得到声学特征向量,并将声学特征向量输入至声码器得到与待处理语音或文本特征向量对应的目标语音。本公开接收语音和文本作为输入,将语音合成任务和语音音色转换任务融合起来,提升了语音合成任务和语音音色转换任务的性能,提供了多种音色克隆的策略
语音生成方法、装置、电子设备及可读存储介质.pdf
本申请实施例提供了一种语音生成方法、装置、电子设备及可读存储介质,同时,由电子设备执行的上述语音生成方法可以使用人工智能模型来执行。而该语音生成方法包括:获取待处理信息;对待处理信息进行编码,得到信息编码结果;基于信息编码结果,生成目标用户对应于目标语言的语音信息。在本申请实施例中,由于在生成语音信息时,是基于目标用户的语音特征、信息编码结果以及目标语言特征来生成的,即在生成语音信息时,考虑到了目标用户的声音特色以及目标语言的语言特征,此时可以保证合成的语音信息与目标用户在说目标语言时的音色更加贴合,提升
语音识别生成代码的方法及装置、电子设备、存储介质.pdf
本申请提供一种语音识别生成代码的方法及装置、电子设备、存储介质,该方法包括:响应于接收的用户语音,通过语音识别技术将用户语音转换成目标文字;根据已建立的索引列表,查找与目标文字匹配的目标索引;根据代码库中不同索引对应的代码段,获取目标索引对应的目标代码,并输出所述目标代码。该方案节约了代码存储空间,方便查找和维护代码。
语音对抗样本生成方法及装置、电子设备及存储介质.pdf
本公开涉及一种语音对抗样本生成方法及装置、电子设备及存储介质,所述方法包括:接收目标文本,并从所述目标文本中提取文本特征序列;将所述文本特征序列输入预先训练好的声学模型,得到多维声学参数序列;将所述多维声学参数序列输入预先训练好的声码器模型,生成语音的时域采样序列,作为目标文本对应的对抗样本,声学模型的输出为多维声学参数序列,使得生成的语音内容在多种声学特征维度描述下保证高相似度(匹配度),因而,在语音对抗样本的生成过程中利用多维声学参数重构方法,能够提升语音对抗样本的抗检测能力,更加有效对语音生成检测模