语音处理方法、装置、电子设备及计算机可读存储介质.pdf
含平****ng
在线预览结束,喜欢就下载吧,查找使用更方便
相关资料
语音处理方法、装置、电子设备及计算机可读存储介质.pdf
本发明公开了一种语音处理方法、装置、电子设备及计算机可读存储介质。其中,该方法包括:获取目标对象的语音,其中,语音中携带有:第一语音指令,音色信息;依据音色信息确定目标对象的身份;在目标对象的身份为预定身份的情况下,调取与预定身份对应的语音指令库,在语音指令库中确定与第一语音指令对应的第二语音指令。本发明解决了相关技术中,难以有效地判断出目标对象的语音指令的指向的技术问题。
语音转换方法、装置、电子设备及可读存储介质.pdf
本发明提供一种语音转换方法、装置、电子设备及可读存储介质。方法包括基于预设切分规则将输入语音切分为多个帧单元;提取每个帧单元的梅尔倒谱特征和基频特征;将帧单元归类到相应的音素集合;根据帧单元的梅尔倒谱特征和平行训练得到的高斯混合模型参数,计算得到输出梅尔倒谱特征;根据输入语音帧单元基频,原始音素集合的基频特征和目标语音素集合的基频特征,计算得到输出基频;根据输出梅尔倒谱特征及输出基频计算得到输入语音转换后对应的输出语音。该方法不仅改善因忽略语音瞬时信息而导致的语音连续性差的缺点,还弥补整体训练的高斯混合模
语音转换方法、装置、电子设备及可读存储介质.pdf
本发明提供一种语音转换方法、装置、电子设备及可读存储介质。所述方法包括基于预设切分规则将待转换语音切分为多个待转换帧单元;提取每个所述待转换帧单元的梅尔倒谱特征;根据音素字典及每个待转换帧单元的梅尔倒谱特征,计算得到多个候选帧单元;根据待转换说话人的帧单元与目标音色说话人的帧单元之间的对应关系,匹配得到目标帧单元;计算转换代价,得到最佳路径;对最佳路径上的目标帧单元进行处理,得到目标语音。该方法在音素字典中计算得到多个候选帧单元,相对于现有技术从整个技术特征字典中查找能节省计算资源提高计算速度,同时将传统
语音识别方法及装置、电子设备、计算机可读存储介质.pdf
本发明公开了一种语音识别方法及装置、电子设备、计算机可读存储介质。其中,该方法包括:生成目标唤醒词对应的唤醒词声学词典和唤醒词语言字典,其中,目标唤醒词为自定义唤醒词;基于唤醒词声学词典和唤醒词语言字典生成解码图;利用解码图对目标语音进行逐帧解码,得到语音识别结果。本发明解决了相关技术中进行语音识别的方式可靠性较低的技术问题。
语音交互方法、装置、电子设备和计算机可读存储介质.pdf
本申请涉及一种语音交互方法和装置、电子设备、计算机可读存储介质,该方法包括:识别用户输入的当前语音内容中是否包括信息查询指令;在识别到用户输入的第一语音内容中包括信息查询指令的情况下,则从数据库中存储的记忆信息中获取与信息查询指令对应的目标记忆信息;其中,记忆信息包括从历史语音内容中所提取的被动记忆信息及主动记忆信息;向用户输出目标记忆信息。那么,在电子设备基于信息查询指令从数据库中进行查询时,就不仅可以查询到被动记忆信息,还可以查询到主动记忆信息,因此,提高了语音交互的智能性。