语音处理方法、装置、电子设备及计算机可读存储介质-豆柴文库

语音处理方法、装置、电子设备及计算机可读存储介质.pdf

2023-07-24

10金币

365KB

10页

含平****ng

实名认证

内容提供者

1/10

2/10

3/10

4/10

5/10

6/10

7/10

8/10

9/10

10/10

在线预览结束，喜欢就下载吧，查找使用更方便

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN114155858A(43)申请公布日2022.03.08(21)申请号202111603676.6(22)申请日2021.12.24(71)申请人珠海格力电器股份有限公司地址519070广东省珠海市前山金鸡西路六号申请人珠海联云科技有限公司(72)发明人岳冬岑淑娟陈翀(74)专利代理机构北京康信知识产权代理有限责任公司11240代理人曾红芳(51)Int.Cl.G10L15/22(2006.01)G10L15/26(2006.01)G10L17/08(2013.01)G06V40/20(2022.01)权利要求书2页说明书6页附图1页(54)发明名称语音处理方法、装置、电子设备及计算机可读存储介质(57)摘要本发明公开了一种语音处理方法、装置、电子设备及计算机可读存储介质。其中，该方法包括：获取目标对象的语音，其中，语音中携带有：第一语音指令，音色信息；依据音色信息确定目标对象的身份；在目标对象的身份为预定身份的情况下，调取与预定身份对应的语音指令库，在语音指令库中确定与第一语音指令对应的第二语音指令。本发明解决了相关技术中，难以有效地判断出目标对象的语音指令的指向的技术问题。CN114155858ACN114155858A权利要求书1/2页1.一种语音处理方法，其特征在于，包括：获取目标对象的语音，其中，所述语音中携带有：第一语音指令，音色信息；依据所述音色信息确定所述目标对象的身份；在所述目标对象的身份为预定身份的情况下，调取与所述预定身份对应的语音指令库，在所述语音指令库中确定与所述第一语音指令对应的第二语音指令。2.根据权利要求1所述的方法，其特征在于，还包括：在所述目标对象的身份不为预定身份的情况下，向预定终端发送授权请求，其中，所述授权请求用于请求在通用指令库中与所述第一语音指令对应的第三语音指令。3.根据权利要求1所述的方法，其特征在于，所述调取与所述预定身份对应的语音指令库，在所述语音指令库中确定与所述第一语音指令对应的第二语音指令，包括：确定所述第一语音指令与所述语音指令库中的预存语音指令的相似度；确定所述相似度大于预定阈值的预存语音指令为第二语音指令。4.根据权利要求3所述的方法，其特征在于，所述确定相似度大于预定阈值的预存语音指令为第二语音指令，包括：在所述相似度大于预定阈值的预存语音指令为多条的情况下，采集所述目标对象的图像；确定所述目标对象的位置，以及所述目标对象当前执行的动作；依据所述位置，以及所述动作，确定所述目标对象的倾向行为；确定匹配所述倾向行为的预存语音指令为第二语音指令。5.根据权利要求4所述的方法，其特征在于，所述依据所述位置，以及所述动作，确定所述目标对象的倾向行为，包括：依据所述位置，以及所述动作，分配对应的权重值至所述目标对象的多种可能性行为；确定所述权重值最高的可能性行为为所述目标对象的倾向行为。6.根据权利要求1至5中任意一项所述的方法，其特征在于，所述调取与所述预定身份对应的语音指令库，在所述语音指令库中确定与所述第一语音指令对应的第二语音指令之后，还包括：发送所述第二语音指令至目标终端以使所述目标终端执行与所述第二语音指令对应的操作。7.一种语音处理装置，其特征在于，包括：获取模块，用于获取目标对象的语音，其中，所述语音中携带有：第一语音指令，音色信息；第一确定模块，用于依据所述音色信息确定所述目标对象的身份；第二确定模块，用于在所述目标对象的身份为预定身份的情况下，调取与所述预定身份对应的语音指令库，在所述语音指令库中确定与所述第一语音指令对应的第二语音指令。8.一种电子设备，其特征在于，包括：处理器；用于存储所述处理器可执行指令的存储器；其中，所述处理器被配置为执行所述指令，以实现如权利要求1至6中任一项所述的语2CN114155858A权利要求书2/2页音处理方法。9.一种计算机可读存储介质，其特征在于，当所述计算机可读存储介质中的指令由电子设备的处理器执行时，使得电子设备能够执行如权利要求1至6中任一项所述的语音处理方法。10.一种计算机程序产品，包括计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的语音处理方法。3CN114155858A说明书1/6页语音处理方法、装置、电子设备及计算机可读存储介质技术领域[0001]本发明涉及智能家居领域，具体而言，涉及一种语音处理方法、装置、电子设备及计算机可读存储介质。背景技术[0002]随着科技的不断发展，家居设备也越来越智能化，各种不同的智能家居设备均可以采用语音控制指令进行控制，但是当同一场景中智能家具设备为多个时，语音操控指令有重叠，相关技术中并不能很好地根据目标对象的语音指令执行目标对象所想表达的真实意

相关资料

语音处理方法、装置、电子设备及计算机可读存储介质.pdf

本发明公开了一种语音处理方法、装置、电子设备及计算机可读存储介质。其中，该方法包括：获取目标对象的语音，其中，语音中携带有：第一语音指令，音色信息；依据音色信息确定目标对象的身份；在目标对象的身份为预定身份的情况下，调取与预定身份对应的语音指令库，在语音指令库中确定与第一语音指令对应的第二语音指令。本发明解决了相关技术中，难以有效地判断出目标对象的语音指令的指向的技术问题。

2023-07-24

365KB

语音转换方法、装置、电子设备及可读存储介质.pdf

本发明提供一种语音转换方法、装置、电子设备及可读存储介质。方法包括基于预设切分规则将输入语音切分为多个帧单元；提取每个帧单元的梅尔倒谱特征和基频特征；将帧单元归类到相应的音素集合；根据帧单元的梅尔倒谱特征和平行训练得到的高斯混合模型参数，计算得到输出梅尔倒谱特征；根据输入语音帧单元基频，原始音素集合的基频特征和目标语音素集合的基频特征，计算得到输出基频；根据输出梅尔倒谱特征及输出基频计算得到输入语音转换后对应的输出语音。该方法不仅改善因忽略语音瞬时信息而导致的语音连续性差的缺点，还弥补整体训练的高斯混合模

2023-06-25

1MB

语音转换方法、装置、电子设备及可读存储介质.pdf

本发明提供一种语音转换方法、装置、电子设备及可读存储介质。所述方法包括基于预设切分规则将待转换语音切分为多个待转换帧单元；提取每个所述待转换帧单元的梅尔倒谱特征；根据音素字典及每个待转换帧单元的梅尔倒谱特征，计算得到多个候选帧单元；根据待转换说话人的帧单元与目标音色说话人的帧单元之间的对应关系，匹配得到目标帧单元；计算转换代价，得到最佳路径；对最佳路径上的目标帧单元进行处理，得到目标语音。该方法在音素字典中计算得到多个候选帧单元，相对于现有技术从整个技术特征字典中查找能节省计算资源提高计算速度，同时将传统

2023-06-25

1.3MB

语音识别方法及装置、电子设备、计算机可读存储介质.pdf

本发明公开了一种语音识别方法及装置、电子设备、计算机可读存储介质。其中，该方法包括：生成目标唤醒词对应的唤醒词声学词典和唤醒词语言字典，其中，目标唤醒词为自定义唤醒词；基于唤醒词声学词典和唤醒词语言字典生成解码图；利用解码图对目标语音进行逐帧解码，得到语音识别结果。本发明解决了相关技术中进行语音识别的方式可靠性较低的技术问题。

2023-07-25

418KB

语音交互方法、装置、电子设备和计算机可读存储介质.pdf

本申请涉及一种语音交互方法和装置、电子设备、计算机可读存储介质，该方法包括：识别用户输入的当前语音内容中是否包括信息查询指令；在识别到用户输入的第一语音内容中包括信息查询指令的情况下，则从数据库中存储的记忆信息中获取与信息查询指令对应的目标记忆信息；其中，记忆信息包括从历史语音内容中所提取的被动记忆信息及主动记忆信息；向用户输出目标记忆信息。那么，在电子设备基于信息查询指令从数据库中进行查询时，就不仅可以查询到被动记忆信息，还可以查询到主动记忆信息，因此，提高了语音交互的智能性。

2023-07-24

1KB