预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共20页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN111444322A(43)申请公布日2020.07.24(21)申请号202010019646.X(22)申请日2020.01.08(71)申请人北京小米松果电子有限公司地址100085北京市海淀区清河朱房路临66号C栋C单元(72)发明人肖克聪宁洪珂赵群(74)专利代理机构北京钲霖知识产权代理有限公司11722代理人李英艳李志新(51)Int.Cl.G06F16/332(2019.01)G06F16/335(2019.01)G06F16/33(2019.01)G10L25/63(2013.01)权利要求书3页说明书10页附图6页(54)发明名称处理语音数据的方法、处理语音数据的装置及存储介质(57)摘要本公开是关于处理语音数据的方法,方法包括:获取语料库,其中语料库包括多个回复语段,其中每个回复语段设置有第一删除值;获取当前的对话请求,其中当前的对话请求基于上一轮的回复语段生成;通过情绪识别模型确定当前的对话请求的情绪置信值;若当前的对话请求的情绪置信值大于上一轮的回复语段的第一删除值,则将上一轮的回复语段的第一删除值更新为当前的对话请求的情绪置信值,得到第二删除值;基于当前的对话请求以及所述第二删除值,选取语料库中的一个回复语段作为当前的对话请求的回复语段。可以实时反馈人机对话质量,对人机交互中的回复语段实时更新,加快数据质量的反馈周期,有利于人机对话系统的快速良好迭代。CN111444322ACN111444322A权利要求书1/3页1.一种处理语音数据的方法,其特征在于,所述方法包括:获取语料库,其中所述语料库包括多个回复语段,其中每个所述回复语段设置有第一删除值;获取当前的对话请求,其中所述当前的对话请求基于上一轮的回复语段生成;通过情绪识别模型确定所述当前的对话请求的情绪置信值;若所述当前的对话请求的情绪置信值大于所述上一轮的回复语段的第一删除值,则将所述上一轮的回复语段的第一删除值更新为所述当前的对话请求的情绪置信值,得到第二删除值;基于所述当前的对话请求以及所述第二删除值,选取所述语料库中的一个所述回复语段作为所述当前的对话请求的回复语段。2.根据权利要求1所述的方法,其特征在于,所述基于所述当前的对话请求以及回复语段的所述第二删除值,选取所述语料库中的一个所述回复语段作为所述当前的对话请求的回复语段,包括:通过对话模型,基于所述当前的对话请求和与所述当前的待识别对话请求的匹配值,选取多个回复语段为多个候选回复语段;根据所述候选回复语段的所述匹配值以及所述第二删除值,确定所述当前的对话请求的回复语段。3.根据权利要求2所述的方法,其特征在于,所述根据所述候选回复语段的所述匹配值以及所述第二删除值,确定所述当前的对话请求的回复语段,包括:将所述第二删除值由小到大进行排序;按照所述第二删除值的从小到大的顺序,确定最小的所述第二删除值;将所述最小的所述第二删除值对应的所述候选回复语段作为所述当前对话请求的回复语段。4.根据权利要求2所述的方法,其特征在于,所述根据所述候选回复语段的所述匹配值以及所述第二删除值,确定所述当前的对话请求的回复语段,还包括:将所述候选回复语段按照所述第二删除值由小到大进行排序;按照所述第二删除值由小到大的顺序选取设置数量的多个所述候选回复语段,作为待选语段;根据所述待选语段的所述匹配值,确定所述当前的对话请求的回复语段。5.根据权利要求2所述的方法,其特征在于,所述根据所述候选回复语段的所述匹配值以及所述第二删除值,确定所述当前的对话请求的回复语段,包括:分别确定所述匹配值的第一权重值以及所述第二删除值的第二权重值;根据所述候选回复语段的所述匹配值、所述第一权重值、第二删除值以及第二权重值得到所述候选回复语段的选取值,其中所述第一权重值大于零,所述第二权重值小于零;选取所述选取值最高的所述候选回复语段作为所述当前对话请求的回复语段。6.根据权利要求1所述的方法,其特征在于,所述方法还包括:若所述回复语段的第二删除值大于删除阈值,则从所述语料库中删除所述回复语段。7.根据权利要求1所述的方法,其特征在于,所述语料库中,所述回复语段的第一删除值的初始值为0。2CN111444322A权利要求书2/3页8.根据权利要求1所述的方法,其特征在于,所述方法还包括:若所述当前的对话请求的情绪置信值小于或等于所述上一轮的回复语段的第一删除值,将所述上一轮的回复语段的所述第一删除值更新为所述当前的对话请求的所述情绪置信值,得到所述第二删除值。9.一种处理语音数据的装置,其特征在于,所述装置包括:获取模块,用于获取语料库,其中所述语料库包括多个回复语段,其中每个所述回复语段设置有第一删除值;获取模块,还用于获取当前的对话请求,其