语音识别方法、装置、设备和存储介质-豆柴文库

语音识别方法、装置、设备和存储介质.pdf

2023-07-24

10金币

678KB

20页

努力****甲寅

实名认证

内容提供者

1/10

2/10

3/10

4/10

5/10

6/10

7/10

8/10

9/10

10/10

亲，该文档总共20页，到这已经超出免费预览范围，如果喜欢就直接下载吧～

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN114187895A(43)申请公布日2022.03.15(21)申请号202111551390.8G10L25/60(2013.01)(22)申请日2021.12.17(71)申请人海尔优家智能科技（北京）有限公司地址100086北京市海淀区知春路106号太平洋国际大厦6层601-606室申请人海尔智家股份有限公司(72)发明人张楠(74)专利代理机构北京同立钧成知识产权代理有限公司11205代理人张娜黄健(51)Int.Cl.G10L15/02(2006.01)G10L15/08(2006.01)G10L21/0208(2013.01)G10L25/51(2013.01)权利要求书2页说明书14页附图3页(54)发明名称语音识别方法、装置、设备和存储介质(57)摘要本申请属于数据处理领域，具体涉及一种语音识别方法、装置、设备和存储介质。本申请旨在解决目前的智能设备识别用户指令的准确率较低的问题。本申请的语音识别方法，该方法包括：获取终端设备上设置的N个语音采集装置采到的N个待处理语音信号；将N个待处理语音信号中第n个待处理语音信号划分为Mn个语音信号片段；提取Mn个语音信号片段中每个语音信号片段的信号特征；根据Mn个语音信号片段一一对应的Mn个信号特征之间的相似度，确定第n个待处理语音信号中包括异常语音信号的Sn个语音信号片段；根据Sn个语音信号片段识别用户指令。CN114187895ACN114187895A权利要求书1/2页1.一种语音识别方法，其特征在于，所述方法包括：获取终端设备上设置的N个语音采集装置采到的N个待处理语音信号，所述N个待处理语音信号与所述N个语音采集装置一一对应，所述N个待处理语音信号中每个待处理语音信号为所述N个语音采集装置中对应的语音采集装置采集的语音信号，N为正整数；将所述N个待处理语音信号中第n个待处理语音信号划分为Mn个语音信号片段，Mn为正整数，n为整数且从1取至N；提取所述Mn个语音信号片段中每个语音信号片段的信号特征；根据所述Mn个语音信号片段一一对应的Mn个信号特征之间的相似度，确定所述第n个待处理语音信号中包括异常语音信号的Sn个语音信号片段；根据所述Sn个语音信号片段识别用户指令。2.根据权利要求1所述的方法，其特征在于，所述将所述N个待处理语音信号中第n个待处理语音信号划分为Mn个语音信号片段，包括：采用预设长度的滑动窗口将所述N个待处理语音信号中第n个待处理语音信号进行划分处理，得到所述Mn个语音信号片段。3.根据权利要求1所述的方法，其特征在于，所述提取所述Mn个语音信号片段中每个语音信号片段的信号特征，包括：对所述Mn个语音信号片段中的每个语音信号片段构建对应的图模型，所述图模型的S个顶点为对应的语音信号片段中的S个数据点，所述图模型的L个边为所述S个数据点中相邻两个数据点之间的连线，S和L为正整数；将所述图模型作为所述Mn个语音信号片段中对应的语音信号片段的信号特征。4.根据权利要求3所述的方法，其特征在于，所述根据所述Mn个语音信号片段一一对应的Mn个信号特征之间的相似度，确定所述第n个待处理语音信号中包括异常语音信号的Sn个语音信号片段，包括：获取Mn个图模型中每相邻两个语音信号片段对应的两个图模型之间的相似度分数；在所述相似度分数大于预设分数阈值时，确定所述两个图模型对应的两个语音信号片段中包括异常语音信号；在所述Mn个图模型对应的第n个待处理语音信号中确定包括所述异常语音信号的Sn个语音信号片段。5.根据权利要求1所述的方法，其特征在于，所述方法还包括：确定N个待处理语音信号中每个待处理语音信号中的所述异常语音信号到达对应的语音采集装置的到达时刻；根据N个到达时刻之间的时差确定所述异常语音信号的发出位置；根据所述发出位置与所述N个语音采集装置的位置在所述N个待处理语音信号中分离出所述异常语音信号。6.根据权利要求5所述的方法，其特征在于，所述根据所述发出位置与所述N个语音采集装置的位置在所述N个待处理语音信号中分离出所述异常语音信号，包括：根据所述发出位置在预设函数库中确定对应的目标传递函数；采用所述目标传递函数对所述N个待处理语音信号进行计算，得到所述异常语音信号。7.根据权利要求5或6所述的方法，其特征在于，所述根据所述Sn个语音信号片段识别用2CN114187895A权利要求书2/2页户指令，包括：检测所述异常语音信号中是否包括预设指令信号；若所述异常语音信号中包括所述预设指令信号，则根据所述Sn个语音信号片段中的所述异常语音信号识别所述用户指令。8.根据权利要求1至6任一项所述的方法，其特征在于，所述N个语音采集装置位于空间坐标系的坐标轴上，所述空间坐标系的原点为所述终端设

相关资料

语音识别方法、装置、设备和存储介质.pdf

本申请属于数据处理领域，具体涉及一种语音识别方法、装置、设备和存储介质。本申请旨在解决目前的智能设备识别用户指令的准确率较低的问题。本申请的语音识别方法，该方法包括：获取终端设备上设置的N个语音采集装置采到的N个待处理语音信号；将N个待处理语音信号中第n个待处理语音信号划分为M

2023-07-24

678KB

视频语音识别方法、装置、设备和存储介质.pdf

本申请提出一种视频语音识别方法、装置、设备和存储介质，涉及语音识别技术领域其中，方法，包括：对视频进行处理，获取多个音频子片段，以及与每个音频子片段对应的图像帧序列；对图像帧序列进行文本识别，获取多个文本结果，并对多个文本结果进行处理，获取多个关键词；通过语音识别模型对每个音频子片段进行处理，获取多个候选语音识别结果；根据多个候选语音识别结果和多个关键词确定每个音频子片段的目标文本识别结果，根据每个音频子片段的目标文本识别结果，获取视频的语音识别结果。由此，通过视频的图像中的文本识别结果辅助视频语音识别，

2023-07-25

824KB

语音识别方法、装置和存储介质.pdf

本发明实施例公开了一种语音识别方法、装置和存储介质；本实施例在获取到音频数据后，可以通过DSP对该音频数据进行模糊语音识别，当确定存在唤醒词时，才由该DSP唤醒处于休眠状态的CPU，并通过CPU对该音频数据进行语义分析，然后，根据分析结果执行相应操作；该方案可以在保留移动性和语音唤醒功能的前提下，大大减少系统功耗，从而延长移动终端的待机时间，改善移动终端的性能。

2023-11-19

808KB

语音识别方法、装置和存储介质.pdf

本公开提出一种语音识别方法、装置和存储介质，涉及语音识别技术领域。本公开的一种语音识别方法，包括：根据当前语句的语音信号获取候选lattice；根据当前语句对应的上文文本重置神经网络模型，其中，上文文本为当前语句的前一句或多句的识别文本；通过重置后的神经网络模型对候选lattice重打分，获取重打分lattice；根据重打分lattice确定当前语句的识别文本。通过这样的方法，对当前语句的语音识别能够考虑到上文一句或多句的信息，从而更加充分的利用先验信息，使重打分更加准确，提高语音识别的准确率。

2023-06-14

529KB

语音识别方法、装置、设备及存储介质.pdf

本发明公开了一种语音识别方法、装置、设备及存储介质。该方法包括:将目标用户语音数据输入设定声学模型中,输出所述目标用户语音数据对应的声学特征序列;其中,所述目标用户语音数据携带有地域属性;所述声学特征序列包括多个声学特征;确定所述声学特征序列中各声学特征对应的至少一个目标词,获得多个目标词;将所述多个目标词输入领域语言模型中,输出目标语音识别结果;其中,所述目标语音识别结果由词序列表征。通过本发明的技术方案,可以提高语音识别的准确性。

2023-04-20

534KB