语音生成方法及装置、存储介质、电子设备.pdf
静芙****可爱
亲,该文档总共34页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
语音生成方法及装置、存储介质、电子设备.pdf
本公开属于语音处理技术领域,涉及一种语音生成方法及装置、存储介质、电子设备。该方法包括:获取待处理语音的语音特征向量,并将语音特征向量输入至语音生成模型得到语言单元向量;获取文本特征向量,并根据文本特征向量和语言单元向量确定待处理特征向量;将待处理特征向量输入至序列到序列模型中得到声学特征向量,并将声学特征向量输入至声码器得到与待处理语音或文本特征向量对应的目标语音。本公开接收语音和文本作为输入,将语音合成任务和语音音色转换任务融合起来,提升了语音合成任务和语音音色转换任务的性能,提供了多种音色克隆的策略
语音生成方法、装置、电子设备及可读存储介质.pdf
本申请实施例提供了一种语音生成方法、装置、电子设备及可读存储介质,同时,由电子设备执行的上述语音生成方法可以使用人工智能模型来执行。而该语音生成方法包括:获取待处理信息;对待处理信息进行编码,得到信息编码结果;基于信息编码结果,生成目标用户对应于目标语言的语音信息。在本申请实施例中,由于在生成语音信息时,是基于目标用户的语音特征、信息编码结果以及目标语言特征来生成的,即在生成语音信息时,考虑到了目标用户的声音特色以及目标语言的语言特征,此时可以保证合成的语音信息与目标用户在说目标语言时的音色更加贴合,提升
语音识别生成代码的方法及装置、电子设备、存储介质.pdf
本申请提供一种语音识别生成代码的方法及装置、电子设备、存储介质,该方法包括:响应于接收的用户语音,通过语音识别技术将用户语音转换成目标文字;根据已建立的索引列表,查找与目标文字匹配的目标索引;根据代码库中不同索引对应的代码段,获取目标索引对应的目标代码,并输出所述目标代码。该方案节约了代码存储空间,方便查找和维护代码。
语音交互方法、装置、电子设备及存储介质.pdf
本公开关于一种语音交互方法、装置、电子设备及存储介质,该方法包括在目标视频播放过程中,获取第一目标采集语音;基于第一目标采集语音进行语音助手唤醒识别,得到第一唤醒识别结果;若第一唤醒识别结果为唤醒目标语音助手,在目标视频对应的播放页面展示预设提示信息,预设提示信息指示目标语音助手唤醒成功,以及基于语音控制与目标视频关联的交互操作。利用本公开实施例可以提升交互便捷性、交互效率以及提升语音交互的精准性。
语音交互方法、装置、电子设备、存储介质.pdf
本发明提供一种语音交互方法、装置、电子设备、存储介质,方法包括:S110:接收语音交互服务请求;S120:根据语音交互服务请求判断其语音服务类型;S131:若语音服务类型为TTS,则直接将语音交互服务请求转发至语音服务引擎;S132:若语音服务类型为ASR,则对第一音频信息进行格式转换;S140:接收来自语音服务引擎的语音交互反馈信息;S150:判断语音交互反馈信息对应的语音交互服务请求的语音服务类型;S161:若语音交互反馈信息对应TTS,则对第二音频信息进行格式转换;S162:若语音交互反馈信息对应A