语音识别方法、装置、终端、系统、介质及产品-豆柴文库

语音识别方法、装置、终端、系统、介质及产品.pdf

2023-05-26

10金币

615KB

18页

猫巷****觅蓉

实名认证

内容提供者

1/10

2/10

3/10

4/10

5/10

6/10

7/10

8/10

9/10

10/10

亲，该文档总共18页，到这已经超出免费预览范围，如果喜欢就直接下载吧～

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

相关资料

语音识别方法、装置、终端、系统、介质及产品.pdf

本申请属于人工智能技术领域,具体提供一种语音识别方法、装置、终端、系统、介质及产品,方法包括:获取目标用户待识别的用户语音数据;将用户语音数据输入AI芯片中训练至收敛的语音识别模型,以生成语音识别结果;其中,语音识别模型为根据用户训练样本和语音识别服务器的通用识别模型训练生成的;语音识别模型与目标用户相匹配;输出语音识别结果。本申请的语音识别方法,通过与用户匹配性较高的语音识别模型对目标用户待识别的用户语音数据进行识别,生成的语音识别结果准确性较高,同时,由于语音识别模型设于AI芯片中,不需要通过网络传输

2023-05-26

615KB

语音识别方法及装置、存储介质、终端.pdf

一种语音识别方法及装置、存储介质、终端，语音识别方法包括：进入特有名词识别模式；获取用户输入的语音，并对所述语音进行识别，得到识别结果；当所述识别结果中存在满足预设组合规则的词语组合时，仅保留所述词语组合中的同音字，所述词语组合包括顺序排列的名词、预设关联词以及所述名词的同音字。本发明技术方案可以提高对特有名词的识别准确性。

2023-11-17

371KB

视听语音识别方法、装置、设备、介质及产品.pdf

本申请提供一种视听语音识别方法、装置、设备、介质及产品，该方法包括：获取待识别的视频特征和对应的含噪语谱图；所述视频特征为基于用户的唇部图像提取的特征；所述含噪语谱图为基于用户的音频数据提取生成的；将所述视频特征和所述含噪语谱图输入预设视听语音增强模型进行降噪处理，输出对应的增强语谱图；将所述增强语谱图和所述视频特征输入预设视听语音识别模型进行语音识别，输出对应的最终字符序列。本申请的视听语音识别方法，通过预设视听语音识别模型对增强语谱图和视频特征两种模态进行识别，以两种模态互补的方式，提高最终字符序列的

2023-06-28

845KB

语音识别方法、装置、移动终端及计算机可读存储介质.pdf

本申请涉及人工智能和语音处理，提供一种语音识别方法、装置、移动终端及计算机可读存储介质，该方法包括：以间隔第一预设时间确定所述移动终端是否处于定位盲区；当确定所述移动终端处于定位盲区时，以间隔第二预设时间基于所述移动终端的传感器数据更新所述移动终端的历史位置信息；当获取到用户的语音数据时，若所述移动终端仍处于定位盲区，则根据更新后的历史位置信息，获取目标语音识别模型；根据所述目标语音识别模型对所述语音数据进行识别，得到所述语音数据对应的标准普通话文本。本申请能够解决移动终端位于定位盲区时，无法定位移动终端

2023-06-27

567KB

语音交互方法、装置、终端设备、存储介质及程序产品.pdf

本申请实施例提供了一种语音交互方法、装置、终端设备、存储介质及程序产品。该方法通过获取用户输入的用户语音，然后，根据用户语音对应的信息以及终端设备的当前工作状态，确定用于响应用户语音的反馈指令，从而根据反馈指令将终端设备自动从当前工作状态切换至另一工作状态，和/或，执行反馈指令对应的目标动作，和/或，执行对话交流，从而通过结合用户语音识别结果与当前工作状态这两个维度联合确定结果的方式，可以使得终端设备在与用户进行语音交互时，能够更加智能、方便、顺畅。

2023-07-25

688KB