语音合成方法、装置、设备、存储介质及程序产品.pdf
努力****妙风
亲,该文档总共22页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
语音合成方法、装置、设备、存储介质及程序产品.pdf
本申请公开了一种语音合成方法、装置、设备、存储介质及程序产品,涉及人工智能领域。该方法包括:响应于文本输入操作,获取输入文本;响应于语音类型选择操作,确定目标语音类型,所述目标语音类型包括目标情感类型与目标音色类型;响应于语音合成操作,按照所述目标语音类型对所述输入文本进行语音合成,得到目标语音,所述目标语音是具有所述目标情感类型对应情感与所述目标音色类型对应音色的音频。本申请实施例提供的方法,可使合成语音具有用户指定的情感特性与音色特性,丰富语音效果,有助于提高合成语音的真实性与自然性。
语音合成方法、装置、设备、存储介质及程序产品.pdf
本申请公开了一种语音合成方法、装置、设备、存储介质及程序产品,涉及人工智能领域。该方法包括:获取目标文本的目标音素、目标情感以及目标音色;对目标音素对应的目标音素特征与目标情感对应的目标情感特征进行特征融合,得到音素融合特征;基于音素融合特征与目标音色对应的目标音色特征进行发音预测,得到目标音素对应的语音发音特征;对语音发音特征进行特征解码,得到目标声学特征;基于目标声学特征合成目标语音,目标语音与目标文本相对应,目标语音是具有目标情感与目标音色的音频。本申请实施例提供的方法,可得到不同情感以及不同音色的
语音增强方法、装置、设备、存储介质及程序产品.pdf
本申请公开了一种语音增强方法、装置、设备、存储介质及程序产品,涉及语音技术处理领域。该方法包括:沿频域维度对待进行语音增强的目标音频进行频带切分,得到至少两个子频带;获取至少两个子频带分别对应的子带能量数据;沿时域维度对至少两个子频带分别对应的子带能量数据进行分析,得到至少两个子频带分别对应的子带能量分布数据;当指定子频带对应的子带能量分布数据符合调整条件的情况下,对指定子频带的子带能量数据进行调整,得到目标增强音频。通过以上方式,能够有选择地对目标音频中不符合调整条件的子带能量数据进行调整,在充分考虑目
语音交互方法、装置、设备、存储介质及程序产品.pdf
本公开提供了一种语音交互方法、装置、设备、存储介质及程序产品,涉及人工智能技术领域,尤其涉及语音技术领域、自然语言处理技术领域、深度学习技术领域。具体实现方案为:监测目标驾舱是否满足语音交互模式的切换条件,语音交互模式包括舱内语音交互模式和舱外语音交互模式;若确定满足语音交互模式的切换条件,则将语音交互模式从当前语音交互模式切换为另一种语音交互模式;采用另一种语音交互模式与目标用户进行语音交互。本公开能够在满足语音交互模式的切换条件时,实现对语音交互模式之间的切换,而且能够实现与用户的多种语音交互方式,全
语音控制方法、装置、设备、存储介质以及程序产品.pdf
本公开提供了一种语音控制方法、装置、设备、存储介质以及程序产品,涉及人工智能领域,具体涉及自然语言处理、语音识别、图像识别、车联网和智能座舱技术,可应用于语音控制场景下。该方法的一具体实施方式包括:响应于接收到语音,获取当前页面的截图;对语音进行语音识别得到语音识别结果;利用截图确定页面的图像识别结果,其中,图像识别结果包括关键词和位置,关键词包括页面中的关键词,位置包括关键词在页面中的位置;在图像识别结果中查找与语音识别结果匹配的关键词作为目标关键词;在页面中目标关键词所在的位置处进行模拟操作,生成语音