基于人工智能的语音识别方法、装置及存储介质.pdf
阳炎****找我
亲,该文档总共23页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
基于人工智能的语音识别方法、装置及存储介质.pdf
本发明涉及人工智能,揭露一种基于人工智能的语音识别方法,包括:将获取的训练数据输入预设联合识别模型的语音识别模块中,获取所述语音识别模块的输出数据以及第一目标任务损失;将所述输出数据输入所述联合识别模型的损失预测模块中,以获取所述损失预测模块的第二目标任务损失;基于所述第一目标任务损失和所述第二目标任务损失,获取所述联合识别模型的总任务损失;基于所述训练数据对所述联合识别模型进行迭代训练,直至所述总任务损失收敛在预设范围内,形成联合识别模型;基于所述联合识别模型中的语音识别模块对待检测语音信号进行识别,并
基于视线的语音识别方法、装置、设备及存储介质.pdf
本发明涉及车辆控制技术领域,其公开了基于视线的语音识别方法、装置、设备及存储介质,通过获取语音监听时间内采集的驾驶员语音信息;根据所述驾驶员语音信息确定对应的初始语义是否完整;在所述初始语义不完整时,确定所述初始语义属于语义缺失或语义冗余;在所述初始语义属于语义缺失或语义冗余时,获取视线转移状态;根据所述视线转移状态确定目标识别语义,并基于所述目标识别语义进行车辆控制,从而将驾驶员的视线结合驾驶员的语音进行意图识别,提高驾驶员意图识别的准确性。
语音识别方法、装置及存储介质.pdf
本公开是关于一种语音识别方法、装置及存储介质,属于机器学习技术领域。方法包括:获取待识别的音频帧;分别提取音频帧的梅尔标度滤波器组特征和发声用户信息矢量;对梅尔标度滤波器组特征和发声用户信息矢量进行融合处理,得到融合特征;基于目标声学模型对融合特征进行处理,得到音频帧的语音识别结果,目标声学模型包括多个空洞卷积层。本公开会同时提取音频帧的梅尔标度滤波器组特征和发声用户信息矢量,之后,将二者进行特征融合并将融合后的特征输入声学模型,由于融合后的特征能够对说话人特征和信道特征进行有效表达,提高了语音识别的准确
基于人工智能的语义识别方法、装置、设备及存储介质.pdf
本发明涉及人工智能,公开一种基于人工智能的语义识别方法、装置、设备及介质,包括:接收客户端发送的语音应答数据,对语音应答数据进行语音转文本处理,得到至少两个转译文本数据,通过预设的转译评估模型对转译文本数据进行转译评分,获取转译评分最高的k个转译文本数据,作为目标数据,针对每个目标数据,从数据库中召回与目标数据关联的n个候选结果,通过孪生网络模型分析转译文本和候选结果之间的文本语义匹配度,得到相似度得分,按转译评分和相似度得分的综合评分由高到低对所有预测结果进行排列,返回评分最高的预测结果,作为目标结果,
基于人工智能的语音合成方法、装置、设备及存储介质.pdf
本申请涉及人工智能中的语音合成领域,提供了一种语音合成方法,包括:获取移动终端发送的语音数据,其中,所述语音数据为由所述移动终端的用户定制的目标对象的语音数据;根据所述语音数据生成语音样本数据集,获取用于将道路导航信息转化为语音数据的语音合成模型;根据所述语音样本数据集对所述语音合成模型进行迭代训练,得到用于合成与所述目标对象具有相同音色的语音数据的目标语音合成模型;将目标语音合成模型发送给移动终端。本申请实现了地图导航的语音多样化和个性化,使得用户可以定制化导航的播报声音,极大地提高了用户体验。本申请还