预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共29页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN115547359A(43)申请公布日2022.12.30(21)申请号202211215274.3(22)申请日2022.09.30(71)申请人支付宝(杭州)信息技术有限公司地址310000浙江省杭州市西湖区西溪路556号8层B段801-11(72)发明人王莹桂王力王磊(74)专利代理机构北京永新同创知识产权代理有限公司11376专利代理师林锦辉刘景峰(51)Int.Cl.G10L25/03(2013.01)G10L25/24(2013.01)G10L25/51(2013.01)权利要求书3页说明书17页附图8页(54)发明名称语音数据处理方法及装置、语音意图理解方法及系统(57)摘要本说明书的实施例提供用于语音意图理解的语音数据处理方法及装置以及语音意图理解方法及系统。在进行语音数据处理时,对语音数据进行语音数据特征提取,以得到第一特征数据。随后,对第一特征数据进行局部频域变换处理,以得到至少一个特征图,每个特征图包括多个元素并且对应第一特征数据中的一个数据块,每个元素对应频域中的一个频率;并且分别使用至少一个特征图中的各个频率所对应的元素,构建各个频率所对应的频率分量通道特征图。然后,从所构建的频率分量通道特征图中筛选出至少一个目标频率分量通道特征图,以得到语音数据的脱敏特征数据,所筛选出的目标频率分量通道特征图是语音意图理解的关键通道特征且是语音信号识别的非关键通道特征。CN115547359ACN115547359A权利要求书1/3页1.一种用于语音意图理解的语音数据处理方法,包括:对语音数据进行语音数据特征提取,以得到第一特征数据;对所述第一特征数据进行局部频域变换处理,以得到至少一个特征图,每个特征图包括多个元素并且对应所述第一特征数据中的一个数据块,每个元素对应频域中的一个频率;分别使用所述至少一个特征图中的各个频率所对应的元素,构建各个频率所对应的频率分量通道特征图;以及从所构建的频率分量通道特征图中筛选出至少一个目标频率分量通道特征图,以得到所述语音数据的脱敏特征数据,所筛选出的目标频率分量通道特征图是语音意图理解的关键通道特征且是语音信号识别的非关键通道特征。2.如权利要求1所述的语音数据处理方法,其中,在从所构建的频率分量通道特征图中筛选出至少一个目标频率分量通道特征图后,所述语音数据处理方法还包括:对所述目标频率分量通道特征图进行第一次洗牌处理,以得到第一洗牌特征图;以及对所述第一洗牌特征图进行归一化处理,得到所述语音数据的脱敏特征数据。3.如权利要求1所述的语音数据处理方法,其中,所述语音数据特征提取包括基于Fbank的语音数据特征提取。4.如权利要求1所述的语音数据处理方法,其中,所述局部频域变换处理包括下述变换处理中的至少一种:局部离散余弦变换、局部小波变换和局部离散傅里叶变换。5.如权利要求1所述的语音数据处理方法,其中,从所构建的频率分量通道特征图中筛选出至少一个目标频率分量通道特征图包括:基于通道重要性或者基于预设筛选规则,从所构建的频率分量通道特征图中筛选出至少一个目标频率分量通道特征图。6.如权利要求5所述的语音数据处理方法,其中,所述通道重要性基于SEnet网络确定出。7.如权利要求5所述的语音数据处理方法,其中,所述预设筛选规则包括:基于频率从低到高的排序来保留预设数目个低频频率分量通道特征图。8.如权利要求2所述的语音数据处理方法,其中,在对所述第一洗牌特征图进行归一化处理后,所述语音数据处理方法还包括:对经过归一化处理后的第一洗牌特征图进行通道混合处理;对经过通道混合处理后的第一洗牌特征图进行第二次洗牌处理,以得到第二洗牌特征图;以及对所述第二洗牌特征图进行归一化处理,以得到所述语音数据的脱敏特征数据。9.如权利要求8所述的语音数据处理方法,其中,所述目标频率分量通道特征图的数目为所述第一特征数据的特征维度加一,对所述第一洗牌特征图进行通道混合处理包括:对所述第一洗牌特征图中的两个相邻频率分量通道特征图进行通道混合。10.如权利要求8所述的语音数据处理方法,其中,所述第一次洗牌处理包括伪随机洗牌处理,以及所述第二洗牌处理包括完全随机洗牌处理。11.如权利要求1或8所述的语音数据处理方法,其中,针对各个频率分量通道特征图的2CN115547359A权利要求书2/3页归一化处理中的归一化系数基于所对应的频率分量通道特征图确定。12.如权利要求8所述的语音数据处理方法,还包括:对经过归一化处理后的第二洗牌特征图沿着时序方向进行等分;以及将等分后的第二洗牌特征图随机打乱后重新拼接,以得到所述语音数据的脱敏特征数据。13.一种语音意图理解方法,包括:获取待识别的语音数据;使用如权利要求1到12中任一所述的语音数据处理方法对