预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共18页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113763968A(43)申请公布日2021.12.07(21)申请号202111049667.7G10L21/0208(2013.01)(22)申请日2021.09.08G10L21/043(2013.01)(71)申请人北京百度网讯科技有限公司地址100085北京市海淀区上地十街10号百度大厦2层(72)发明人赵情恩(74)专利代理机构北京英赛嘉华知识产权代理有限责任公司11204代理人王达佐马晓亚(51)Int.Cl.G10L17/26(2013.01)G10L17/04(2013.01)G10L17/02(2013.01)G10L17/18(2013.01)G10L17/20(2013.01)权利要求书3页说明书10页附图4页(54)发明名称用于识别语音的方法、装置、设备、介质和产品(57)摘要本公开提供了用于识别语音的方法、装置、设备、介质和产品,涉及人工智能技术领域,尤其涉及语音技术领域。具体实现方案为:获取目标语音;基于目标语音和预设的语音识别模型,确定目标语音对应的用户特征向量集合;将用户特征向量集合中的各个用户特征向量拼接,得到目标特征向量;基于目标特征向量,确定目标语音对应的用户特征信息。本实现方式可以提高对用户特征的识别准确度。CN113763968ACN113763968A权利要求书1/3页1.一种用于识别语音的方法,包括:获取目标语音;基于所述目标语音和预设的语音识别模型,确定所述目标语音对应的用户特征向量集合;将所述用户特征向量集合中的各个用户特征向量拼接,得到目标特征向量;基于所述目标特征向量,确定所述目标语音对应的用户特征信息。2.根据权利要求1所述的方法,其中,所述用户特征向量集合至少包括年龄特征向量和性别特征向量;以及所述基于所述目标特征向量,确定所述目标语音对应的用户特征信息,包括:基于所述目标特征向量,确定所述目标语音对应的年龄性别联合特征信息。3.根据权利要求1所述的方法,其中,所述预设的语音识别模型至少包括编码器集合;以及所述基于所述目标语音和预设的语音识别模型,确定所述目标语音对应的用户特征向量集合,包括:对于所述编码器集合中的每个编码器,基于所述目标语音和该编码器,确定该编码器对应的用户特征向量;基于所述编码器集合中各个编码器对应的用户特征向量,确定所述用户特征向量集合。4.根据权利要求1所述的方法,其中,所述预设的语音识别模型至少包括解码器;以及所述基于所述目标特征向量,确定所述目标语音对应的用户特征信息,包括:基于所述目标特征向量和所述解码器,确定所述目标语音对应的所述用户特征信息。5.根据权利要求1所述的方法,其中,所述预设的语音识别模型基于以下步骤训练得到:获取语音样本和样本标注数据;对于编码器集合中的每个编码器,基于所述语音样本和所述样本标注数据,对该编码器进行训练,得到训练完成的编码器;基于各个所述训练完成的编码器,对解码器进行训练,得到训练完成的解码器;基于各个所述训练完成的编码器和所述训练完成的解码器,确定所述预设的语音识别模型。6.根据权利要求5所述的方法,其中,所述训练完成的编码器至少包括年龄编码器和性别编码器;以及所述基于各个所述训练完成的编码器,对解码器进行训练,得到训练完成的解码器,包括:基于所述语音样本和所述年龄编码器,确定样本年龄特征向量;基于所述语音样本和所述性别编码器,确定样本性别特征向量;将所述样本年龄特征向量和所述样本性别特征向量进行拼接,得到样本特征向量;基于所述样本特征向量和所述样本标注数据,对解码器进行训练,得到所述训练完成的解码器。7.一种用于识别语音的装置,包括:2CN113763968A权利要求书2/3页语音获取单元,被配置成获取目标语音;特征确定单元,被配置成基于所述目标语音和预设的语音识别模型,确定所述目标语音对应的用户特征向量集合;特征拼接单元,被配置成将所述用户特征向量集合中的各个用户特征向量拼接,得到目标特征向量;语音识别单元,被配置成基于所述目标特征向量,确定所述目标语音对应的用户特征信息。8.根据权利要求7所述的装置,其中,所述用户特征向量集合至少包括年龄特征向量和性别特征向量;以及所述语音识别单元进一步被配置成:基于所述目标特征向量,确定所述目标语音对应的年龄性别联合特征信息。9.根据权利要求7所述的装置,其中,所述预设的语音识别模型至少包括编码器集合;以及所述特征确定单元进一步被配置成:对于所述编码器集合中的每个编码器,基于所述目标语音和该编码器,确定该编码器对应的用户特征向量;基于所述编码器集合中各个编码器对应的用户特征向量,确定所述用户特征向量集合。10.根据权利要求7所述的装置,其中,所述预设的语音识别模型至少包括解码器;以及所