预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共18页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN114186061A(43)申请公布日2022.03.15(21)申请号202111517296.0(22)申请日2021.12.13(71)申请人深圳壹账通智能科技有限公司地址518000广东省深圳市前海深港合作区前湾一路1号A栋201室(入驻深圳市前海商务秘书有限公司)(72)发明人李好叶松王振华(74)专利代理机构北京中强智尚知识产权代理有限公司11448代理人贾依娇(51)Int.Cl.G06F16/35(2019.01)G06F40/289(2020.01)权利要求书2页说明书11页附图4页(54)发明名称语句意图预测方法、装置、存储介质及计算机设备(57)摘要本发明公开了一种语句意图预测方法、装置、存储介质及计算机设备,涉及信息技术领域,主要在于能够提高语句之间相似度计算的准确度,进而提高语句意图的预测精度。其中方法包括:获取目标业务场景下的待预测语句;基于与所述目标业务场景相贴合的预设词汇词库,对所述待预测语句和预设意图语料库中的多个语料分别进行分词处理,得到所述待预测语句对应的各个分词和所述多个语料分别对应的各个关键词;基于所述各个分词和所述各个关键词,计算所述多个语料分别与所述待预测语句之间的相似度;根据计算的多个相似度,确定所述待预测语句对应的意图。本发明适用于对语句意图进行预测。CN114186061ACN114186061A权利要求书1/2页1.一种语句意图预测方法,其特征在于,包括:获取目标业务场景下的待预测语句;基于与所述目标业务场景相贴合的预设词汇词库,对所述待预测语句和预设意图语料库中的多个语料分别进行分词处理,得到所述待预测语句对应的各个分词和所述多个语料分别对应的各个关键词;基于所述各个分词和所述各个关键词,确定所述待预测语句对应的分词占有率和所述多个语料分别对应的分词命中率;基于所述分词占有率和所述分词命中率,计算所述多个语料分别与所述待预测语句之间的相似度;根据计算的多个相似度,确定所述待预测语句对应的意图。2.根据权利要求1所述的方法,其特征在于,所述基于所述各个分词和所述各个关键词,确定所述待预测语句对应的分词占有率和所述多个语料分别对应的分词命中率,包括:确定所述各个分词对应的第一数量,所述各个关键词对应的第二数量,以及确定所述各个分词和所述各个关键词中相同分词对应的第三数量;将所述第三数量与所述第一数量相除,得到所述待预测语句对应的分词占有率;将所述第三数量与所述第二数量相除,得到所述多个语料分别对应的分词命中率。3.根据权利要求2所述的方法,其特征在于,在所述确定所述各个分词和所述各个关键词中相同分词对应的第三数量之后,所述方法还包括:将所述各个分词中的所述相同分词去除,得到所述待预测语句对应的各个剩余分词;基于预设停用词库,将所述各个剩余分词中的停用词去除,得到所述待预测语句对应的目标分词;确定所述目标分词对应的同义分词,并将所述目标分词和与其对应的同义分词进行替换,得到替换后的待预测语句;确定所述替换后的待预测语句对应的各个分词和所述各个关键词中相同分词对应的第四数量;所述将所述第三数量与所述第一数量相除,得到所述待预测语句对应的分词占有率,包括:将所述第四数量与所述第一数量相除,得到所述替换后的待预测语句对应的分词占有率;所述将所述第三数量与所述第二数量相除,得到所述多个语料分别对应的分词命中率,包括:将所述第四数量与所述第二数量相除,得到所述多个语料分别对应的分词命中率。4.根据权利要求3所述的方法,其特征在于,所述确定所述目标分词对应的同义分词,包括:将所述目标分词和预设字符字典中的词语分别输入至预设特征向量提取模型中进行语义特征向量的提取,得到所述目标分词对应的第一语义特征向量和所述词语对应的第二语义特征向量;基于所述第一语义特征向量和所述第二语义特征向量,计算所述目标分词与所述词语之间的余弦相似度;2CN114186061A权利要求书2/2页判断所述余弦相似度是否大于预设相似度,若大于所述预设相似度,则将所述余弦相似度对应的词语确定为所述目标分词对应的同义分词。5.根据权利要求1所述的方法,其特征在于,所述基于所述分词占有率和所述分词命中率,计算所述多个语料分别与所述待预测语句之间的相似度,包括:确定所述分词占有率对应的第一权重系数,以及所述分词命中率对应的第二权重系数;基于所述第一权重系数和所述第二权重系数,将所述分词占有率与所述分词命中率相加,得到所述多个语料分别与所述待预测语句之间的相似度。6.根据权利要求1所述的方法,其特征在于,所述根据计算的多个相似度,确定所述待预测语句对应的意图,包括:从所述多个相似度中确定最大相似度,并将所述最大相似度对应的语料意图确定为所述待预测语句对应