语音合成和语音识别.pdf
念珊****写意
亲,该文档总共22页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
语音合成和语音识别.pdf
根据本公开的实现,提出了用于语音合成和语音识别的方案。根据该方案,支持至少一种语言的语音合成(TTS)模型和自动语音识别(ASR)模型被获取。基于目标语言的第一组配对数据来调整该TTS模型和ASR模型,以支持目标语言。然后,基于第一组配对数据和由ASR模型生成的该目标语言的第一组合成配对数据来优化该TTS模型,同时基于第一组配对数据和由TTS模型生成的该目标语言的第二组合成配对数据来优化该ASR模型。以此方式,该方案能够利用较少的训练数据为缺乏训练数据的语言提供具有较高准确性的TTS模型和ASR模型。
语音识别装置、语音识别程序和语音识别方法.pdf
本发明的目的在于,提供一种便利性更高的语音识别装置的技术。本发明的语音识别装置的特征在于,具备:存储部,其存储使画面与该画面中的选项对应的画面定义信息和确定每个选项曾被选择的次数的选择履历信息;接触指示接受部,其通过接触的操作接受指示;语音指示接受部,其通过语音的操作接受指示;和选项朗读部,当在规定画面中限制接触指示接受部接受指示时,该选项朗读部将规定画面中的选项以与曾被选择的次数相应的顺序语音输出,语音指示接受部对通过选项朗读部输出的选项中的任一项接受指示。
基于语音识别和语音合成的汉语语音转换技术研究的综述报告.docx
基于语音识别和语音合成的汉语语音转换技术研究的综述报告随着智能家居、智能移动设备等技术的不断发展,语音转换技术越来越受到关注。基于语音识别和语音合成的汉语语音转换技术,是其中的一个重要研究方向,本文将对其进行综述。一、语音识别技术语音识别技术(ASR)是将语音信号转化成相应的文本或命令的过程。在汉语语音转换中,语音识别技术是其中的核心部分。在汉语语音识别中,以Google为代表的商用语音识别技术是比较先进的,同时还有讯飞、百度等国内厂商推出的语音识别技术,它们的准确率和识别速度都有很大的提高。此外,汉语语
一种语音识别方法和语音识别装置.pdf
本申请实施例提供一种语音识别方法和语音识别装置,该方法包括:对语音数据流进行加窗处理,确定位于窗口内的语音数据;对窗口内的语音数据进行对象识别处理,并根据对象识别处理结果对窗口进行长度调整,并将位于调整后的窗口内的语音数据确定为目标语音段;基于识别模型对目标语音段进行语音识别处理,得到目标识别结果。这样,在对语音数据流进行加窗处理时,根据对象识别处理的结果灵活调整窗口长度,以得到不同大小的目标语音段,能够兼顾识别速度和识别效果,从而综合改善端对端语音识别场景的语音识别性能。
人脸识别与语音合成融合系统.pdf
本发明涉及人脸识别与语音合成技术领域,是融合人脸识别与语音合成技术的人脸识别系统,包括:图像获取单元,用于采集人脸识别区域内的图像;样本训练单元,用于对采集到的样本数据并训练模型;动态识别单元,用于动态实时识别人脸;静态识别单元,用于静态识别人脸;语音合成单元,用于语音播报动态识别单元和静态识别单元识别的人脸标识;人脸识别和语音播报功能融合单元,用于实时播报识别出的人脸信息标志。本发明具有速度快,技术融合使得各项操作更加人性化和智能化。本发明直接语音播报识别结果,对于视力有问题的人,比如老人、盲人更加友好