预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共19页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN114218356A(43)申请公布日2022.03.22(21)申请号202111537450.0G06N3/08(2006.01)(22)申请日2021.12.15(71)申请人平安科技(深圳)有限公司地址518000广东省深圳市福田区福田街道福安社区益田路5033号平安金融中心23楼(72)发明人赵仕豪马骏王少军(74)专利代理机构深圳市世联合知识产权代理有限公司44385代理人刘畅(51)Int.Cl.G06F16/33(2019.01)G06F40/205(2020.01)G06F40/30(2020.01)G06N3/04(2006.01)权利要求书3页说明书12页附图3页(54)发明名称基于人工智能的语义识别方法、装置、设备及存储介质(57)摘要本发明涉及人工智能,公开一种基于人工智能的语义识别方法、装置、设备及介质,包括:接收客户端发送的语音应答数据,对语音应答数据进行语音转文本处理,得到至少两个转译文本数据,通过预设的转译评估模型对转译文本数据进行转译评分,获取转译评分最高的k个转译文本数据,作为目标数据,针对每个目标数据,从数据库中召回与目标数据关联的n个候选结果,通过孪生网络模型分析转译文本和候选结果之间的文本语义匹配度,得到相似度得分,按转译评分和相似度得分的综合评分由高到低对所有预测结果进行排列,返回评分最高的预测结果,作为目标结果,获取目标结果对应的转译文本数据,作为识别结果,采用本发明可提高语义识别的准确率。CN114218356ACN114218356A权利要求书1/3页1.一种基于人工智能的语义识别方法,其特征在于,所述基于人工智能的语义识别方法包括:接收客户端发送的语音应答数据;采用语音识别算法对语音应答数据进行语音转文本处理,得到至少两个转译文本数据;通过预设的转译评估模型对所述转译文本数据进行转译评分,并获取转译评分最高的k个转译文本数据,作为目标数据,其中,k为正整数;针对每个所述目标数据,通过设定的召回策略,从数据库中召回与所述目标数据关联的n个候选结果,其中,n为正整数,每个所述目标数据对应所述数据库中的多个候选结果;将每个目标数据及召回的候选结果传入到孪生网络模型中,通过所述孪生网络模型分析转译文本和候选结果之间的文本语义匹配度,得到相似度得分;结合所述转译评分以及所述相似度得分确定综合评分,按所述综合评分由高到低对所有预测结果进行排列,返回评分最高的预测结果,作为目标结果,并获取目标结果对应的转译文本数据,作为识别结果。2.如权利要求1所述的基于人工智能的语义识别方法,其特征在于,所述通过设定的召回策略从数据库中召回与所述目标数据关联的n个候选结果包括:对数据库中所述目标数据对应的每个候选结果进行语素解析,得到若干基础语素,将同一候选结果对应的基础语素,作为一组基础语素;计算每个所述基础语素与所述目标数据的相关性得分;将所述相关性得分进行加权求和,得到该组基础语素与所述目标数据的相关性得分;对所有相关性得分按照由大到小的顺序进行排序,并从前往后选取n个候选结果,作为召回的候选结果。3.如权利要求2所述的基于人工智能的语义识别方法,其特征在于,所述将所述相关性得分进行加权求和,得到该组基础语素与所述目标数据的相关性得分包括:采用如下公式计算该组基础语素与所述目标数据的相关性得分:其中,Score(Q,d)为该组基础语素与目标数据的相关性得分,Q表示所述候选结果,qi表示每个所述候选结果解析之后的一个语素,d为所述目标数据;W表示语素qi的权重;R(qi,d)表示语素qi与所述目标数据d的相关性得分。4.如权利要求2所述的基于人工智能的语义识别方法,其特征在于,所述对所有相关性得分按照由大到小的顺序进行排序,并从前往后选取n个候选结果,作为召回的候选结果包括:获取预设相关性得分阈值;将n个召回的候选结果对应的相关性得分与所述预设相关性得分阈值进行比较,得到比较结果;若比较结果中存在召回的候选结果对应的相关性得分小于所述预设相关性得分阈值,则将该类候选结果作为无效候选结果,并从所述召回的候选结果中剔除所述无效候选结2CN114218356A权利要求书2/3页果。5.如权利要求1所述的基于人工智能的语义识别方法,其特征在于,所述获取转译评分最高的k个转译文本数据,作为目标数据包括:基于最小堆Top‑k算法,从所有转译文本数据中,任意选取k个转译文本数据的转译评分,建立最小堆,其中,所述最小堆包括堆顶,所述堆顶为k个转译文本数据的转译评分中的最小分数,未被选取的转译文本数据作为剩余转译数据;选取所述剩余转译数据中任一个的转译评分,作为对比评分,并将所述对比评分与所述堆顶的评分进行比较,直到所述剩余转译数据选取完