语音合成、情绪迁移、交互方法、存储介质、程序产品.pdf
文库****坚白
亲,该文档总共24页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
语音合成、情绪迁移、交互方法、存储介质、程序产品.pdf
本申请提供了一种语音合成、情绪迁移方法、存储介质、程序产品,语音生成方法,包括:根据目标情绪以及待合成语音文本对应的音素序列进行韵律生成,得到待合成语音文本对应的音素级别的韵律信息;将音素级别的韵律信息上采样至语音帧级别,得到待合成语音文本对应的语音帧特征;将目标说话人的音色特征融入语音帧特征,并根据融入音色特征后的语音帧特征,生成与待合成语音文本对应的、并且以目标情绪表达的目标说话人语音。本方案先根据和音色无关的音素序列以及情绪生成韵律信息,再将音色融入韵律信息,可以将音色和韵律进行解耦,保证了语音帧特
语音交互方法、装置、设备、存储介质及程序产品.pdf
本公开提供了一种语音交互方法、装置、设备、存储介质及程序产品,涉及人工智能技术领域,尤其涉及语音技术领域、自然语言处理技术领域、深度学习技术领域。具体实现方案为:监测目标驾舱是否满足语音交互模式的切换条件,语音交互模式包括舱内语音交互模式和舱外语音交互模式;若确定满足语音交互模式的切换条件,则将语音交互模式从当前语音交互模式切换为另一种语音交互模式;采用另一种语音交互模式与目标用户进行语音交互。本公开能够在满足语音交互模式的切换条件时,实现对语音交互模式之间的切换,而且能够实现与用户的多种语音交互方式,全
语音识别方法、交互方法、存储介质及程序产品.pdf
本申请实施例提供了一种语音识别方法、交互方法、存储介质及程序产品,语音识别方法,包括:根据待识别语音的语音特征,获得所述待识别语音对应的多个候选字符序列及其对应的第一分数;获取所述待识别语音对应的发音对象的偏好词语;将多个所述候选字符序列与所述偏好词语进行匹配,根据匹配结果确定多个所述候选字符序列分别对应的第二分数;根据多个所述候选字符序列各自对应的第一分数以及第二分数,从多个所述候选字符序列中确定出作为语音识别结果的目标字符序列。
语音交互方法、装置、终端设备、存储介质及程序产品.pdf
本申请实施例提供了一种语音交互方法、装置、终端设备、存储介质及程序产品。该方法通过获取用户输入的用户语音,然后,根据用户语音对应的信息以及终端设备的当前工作状态,确定用于响应用户语音的反馈指令,从而根据反馈指令将终端设备自动从当前工作状态切换至另一工作状态,和/或,执行反馈指令对应的目标动作,和/或,执行对话交流,从而通过结合用户语音识别结果与当前工作状态这两个维度联合确定结果的方式,可以使得终端设备在与用户进行语音交互时,能够更加智能、方便、顺畅。
语音合成方法、装置、设备、存储介质及程序产品.pdf
本申请公开了一种语音合成方法、装置、设备、存储介质及程序产品,涉及人工智能领域。该方法包括:获取目标文本的目标音素、目标情感以及目标音色;对目标音素对应的目标音素特征与目标情感对应的目标情感特征进行特征融合,得到音素融合特征;基于音素融合特征与目标音色对应的目标音色特征进行发音预测,得到目标音素对应的语音发音特征;对语音发音特征进行特征解码,得到目标声学特征;基于目标声学特征合成目标语音,目标语音与目标文本相对应,目标语音是具有目标情感与目标音色的音频。本申请实施例提供的方法,可得到不同情感以及不同音色的