一种用于语音识别方法及系统-豆柴文库

一种用于语音识别方法及系统.pdf

2023-12-07

10金币

887KB

18页

一吃****新冬

实名认证

内容提供者

1/10

2/10

3/10

4/10

5/10

6/10

7/10

8/10

9/10

10/10

亲，该文档总共18页，到这已经超出免费预览范围，如果喜欢就直接下载吧～

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN105679310A(43)申请公布日2016.06.15(21)申请号201510790077.8(22)申请日2015.11.17(71)申请人乐视致新电子科技（天津）有限公司地址300467天津市滨海新区天津生态城动漫中路126号动漫大厦B1区二层201-427(72)发明人王育军赵恒艺(74)专利代理机构北京润泽恒知识产权代理有限公司11319代理人苏培华(51)Int.Cl.G10L15/02(2006.01)G10L15/04(2013.01)权利要求书3页说明书10页附图4页(54)发明名称一种用于语音识别方法及系统(57)摘要本发明实施例公开了一种用于语音识别的方法及系统，包括：从监听的语音信号中截取第一语音片段，对所述第一语音片段进行分析确定能量谱；依据所述能量谱对所述第一语音片段进行特征提取，确定语音特征；依据所述语音特征对所述第一语音片段的能量谱进行分析，截取第二段语音片段；对所述第二段语音片段进行语音识别，得到语音识别结果。通过实施上述方法，解决了现有技术中在离线状态下，识别功能单一、识别率低的问题。CN105679310ACN105679310A权利要求书1/3页1.一种用于语音识别的方法，其特征在于，包括：从监听的语音信号中截取第一语音片段，对所述第一语音片段进行分析确定能量谱；依据所述能量谱对所述第一语音片段进行特征提取，确定语音特征；依据所述语音特征对所述第一语音片段的能量谱进行分析，截取第二段语音片段；对所述第二段语音片段进行语音识别，得到语音识别结果。2.根据权利要求1所述方法，其特征在于，所述从监听的语音信号中截取第一语音片段，包括：监听语音信号，对监听的语音信号的能量值进行检测；依据第一能量阈值与第二能量阈值，确定所述语音信号的起点与终点；其中，第一能量阈值大于第二能量阈值；将起点与终点间的语音信号作为第一语音片段。3.根据权利要求1所述方法，其特征在于，所述依据所述能量谱对所述第一语音片段进行特征提取，确定语音特征，包括：基于第一模型对第一语音片段对应的能量谱进行分析，提取语音识别特征，其中，语音识别特征包括：频倒谱系数MFCC特征、感知线性预测PLP特征、或线性鉴别分析LDA特征；基于第二模型对第一语音片段对应的能量谱进行分析，提取说话人语音特征，其中，说话人语音特征包括：高阶频倒谱系数MFCC特征；将第一语音片段对应的能量谱转换功率谱，分析功率谱得到基频特征。4.根据权利要求1所述方法，其特征在于，所述依据所述语音特征对所述第一语音片段的能量谱进行分析，截取第二段语音片段，包括：依据语音识别特征与基频特征，基于第三模型检测第一语音片段的能量谱，确定静音部分和语音部分；依据所述第一语音片段中的第一个语音部分确定起点；当所述静音部分的时长超过静音阈值时，依据所述静音部分之前的语音部分确定终点；提取起点和终点之间的语音信号生成第二语音片段。5.根据权利要求1所述方法，其特征在于，所述的方法还包括：预先存储各用户的用户语音特征；依据每个用户的用户语音特征构建说用户语音模型，其中，所述用户语音模型用于确定语音信号对应用户。6.根据权利要求5所述方法，其特征在于，对所述第二段语音片段进行语音识别，得到语音识别结果之前，还包括：将说话人语音特征和基频特征输入用户语音模型进行说话人验证；当说话人验证通过时，从所述第二段语音片段中提取唤醒信息，其中，所述唤醒信息包括唤醒词或唤醒意图信息。7.根据权利要求1-6所述的任一方法，其特征在于，得到语音识别结果之后，所述方法还包括：采用预置语义规则对语音识别结果进行语义解析匹配，其中，所述语义解析匹配包括以下至少一种：精确匹配、语义要素匹配和模糊匹配；2CN105679310A权利要求书2/3页对语义解析结果进行场景分析，提取至少一个语义标签；依据语义标签确定操作指令，执行所述操作指令。8.一种用于语音识别的系统，其特征在于，包括：第一截取模块，用于从监听的语音信号中截取第一语音片段，对所述第一语音片段进行分析确定能量谱；特征提取模块，用于依据所述能量谱对所述第一语音片段进行特征提取，确定语音特征；第二截取模块，用于依据所述语音特征对所述第一语音片段的能量谱进行分析，截取第二段语音片段；语音识别模块，用于对所述第二段语音片段进行语音识别，得到语音识别结果。9.根据权利要求8所述系统，其特征在于，所述第一截取模块，包括：监听子模块，用于监听语音信号，对监听的语音信号的能量值进行检测；起点终点确定子模块，用于依据第一能量阈值与第二能量阈值，确定所述语音信号的起点与终点；其中，第一能量阈值大于第二能量阈值；截取子模块，用于将起点与终点间的语音信号作为第一语音片段。10.根据权利要求8所述

相关资料

一种用于语音识别方法及系统.pdf

本发明实施例公开了一种用于语音识别的方法及系统，包括：从监听的语音信号中截取第一语音片段，对所述第一语音片段进行分析确定能量谱；依据所述能量谱对所述第一语音片段进行特征提取，确定语音特征；依据所述语音特征对所述第一语音片段的能量谱进行分析，截取第二段语音片段；对所述第二段语音片段进行语音识别，得到语音识别结果。通过实施上述方法，解决了现有技术中在离线状态下，识别功能单一、识别率低的问题。

2023-12-07

887KB

用于车载的语音识别方法及系统.pdf

本发明实施例提供一种用于车载的语音识别方法。该方法包括：使用多个麦克风对车载空间进行音区信号分离，至少将车载空间分为多个音区，根据各音区内的麦克风组成分布式麦克风网络；通过分布式麦克风网络实时采集车载环境下的音频，根据回声消除算法抑制音频中的车载环境自噪声；通过盲源分离算法对抑制音频中多个说话人的声音进行分离；通过分布式麦克风网络定位每个说话人所在的音区，没有说话人发出的声音时，将声音采集为噪音估计，有说话人发出的声音时，根据前一帧采集的噪音估计进行降噪，确定出干净语音进行语音识别。本发明实施例还提供一种

2023-06-27

590KB

一种语音识别方法及系统.pdf

本申请公开了一种语音识别方法及系统，获取原始语音信号，利用预设深度残差收缩网络模型中的深度残差收缩网络对待识别的原始语音信号进行滤除处理，得到目标语音频谱，从目标语音频谱中提取语音时序特征，通过深度残差收缩网络的预设分类层对语音时序特征进行分类，得到目标语音频谱对应的字符概率，通过预设预测模型对字符概率进行预测得到文本信息。通过上述，由于预设深度残差收缩网络模型中融入了残差模块和软阈值函数，因此具有特征提取能力强和去除噪声的特性，利用预设深度残差收缩网络模型中的深度残差收缩网络去除原始语音频谱所包含的无关

2023-07-25

752KB

一种语音识别方法及系统.pdf

本发明涉及一种语音识别的技术领域，揭露了一种语音识别方法，包括：获取待识别语音信号，并计算待识别语音信号的能量密度谱；将能量密度谱进行伪彩色映射，得到待识别语音信号的彩色语谱图；利用自适应的时域滤波器对彩色语谱图中的语音信号进行回声消除；利用盲源分离算法估计待识别语音中目标语音信号的mask值；利用基于mask值的多通道增强算法对目标语音信号进行增强；利用预训练的DFSMN‑CTC模型对语音信号进行识别，得到语音识别结果。本发明还提出一种语音识别系统。本发明实现了语音的识别。

2023-06-27

985KB

一种语音识别方法、装置和用于语音识别的装置.pdf

本发明实施例提供了一种语音识别方法、装置和用于语音识别的装置。所述方法包括：根据待处理的语音数据中各个说话人的声学特征，对所述语音数据进行切分处理，得到若干子句，每个子句包含一个说话人的语音片段；按照预设标签对所述子句进行归并处理，得到目标子句；对所述目标子句进行语音识别处理，得到所述语音数据的语音识别结果。本发明实施例可以保证每个子句的能量、说话人音调、音色的相对统一，有利于提升语音识别的准确度；并且，本发明实施例进一步还可以按照预设标签对子句进行归并处理，将存在关联关系的子句合并为目标子句，再对目标子

2023-07-25

534KB