预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共18页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113704413A(43)申请公布日2021.11.26(21)申请号202111016963.7(22)申请日2021.08.31(71)申请人平安普惠企业管理有限公司地址518000广东省深圳市前海深港合作区前湾一路1号A栋201室(入驻深圳市前海商务秘书有限公司)(72)发明人吴绍锋(74)专利代理机构深圳国新南方知识产权代理有限公司44374代理人李小东(51)Int.Cl.G06F16/33(2019.01)G06F16/35(2019.01)G06F40/30(2020.01)G06K9/62(2006.01)权利要求书3页说明书9页附图5页(54)发明名称基于多样本的意图分类方法、装置、设备及存储介质(57)摘要本发明涉及人工智能及数字医疗领域,公开了一种基于多样本的意图分类方法、装置、设备及存储介质。该方法包括:获取电话语音中的文本样本并识别不均衡意图类别的目标样本;根据目标样本基于k‑mean聚类算法生成新的目标样本,将新的目标样本和均衡意图类别的文本样本形成训练样本集;将训练样本集分批输入预构建好的意图分类模型中,获得每个训练样本的预测结果,根据预测结果计算计算损失函数,采用损失函数对意图分类模型进行训练,得到目标意图分类模型;获取待测文本样本,将待测文本样本输入目标意图分类模型中,得到待测文本样本的意图类别。本发明能够解决多样本数据不均衡导致意图分类模型的识别精度降低,不能准确识别客户意图的问题。CN113704413ACN113704413A权利要求书1/3页1.一种基于多样本的意图分类方法,其特征在于,包括:获取电话语音中的文本样本,对所述文本样本的类别属性进行标注处理,根据标注处理结果识别所述文本样本的意图类别,获得不均衡意图类别的文本样本以及均衡意图类别的文本样本,将不均衡意图类别的文本样本识别为目标样本;基于k‑mean聚类算法,根据所述目标样本生成新的目标样本,根据新的目标样本和均衡意图类别的文本样本形成训练样本集;将训练样本集分批输入预构建好的意图分类模型中,获得每个训练样本的预测结果,根据所述预测结果计算每个训练样本的梯度模长,根据所有所述梯度模长划分梯度区间,按照所述梯度区间对所述训练样本进行分类处理并根据分类处理结果计算梯度区间密度,根据所述梯度区间密度计算损失函数,采用所述损失函数对所述意图分类模型进行训练,得到目标意图分类模型;获取待测文本样本,将所述待测文本样本输入所述目标意图分类模型中,得到所述待测文本样本的意图类别。2.根据权利要求1所述的意图分类方法,其特征在于,基于k‑mean聚类算法,根据所述目标样本生成新的目标样本的步骤包括:根据均衡意图类别的文本样本数量确定所述目标样本需均衡的数量;采用k‑mean聚类算法将所述目标样本划分为多个样本簇;重复执行从所述样本簇中随机选取一个样本簇,每次从选取出的样本簇中随机选取多个不同的子样本并获取各个子样本的中心,将所述中心作为新的目标样本直至新的目标样本的数量达到所述目标样本需均衡的数量为止。3.根据权利要求2所述的意图分类方法,其特征在于,采用k‑mean聚类算法将所述目标样本划分为多个样本簇的步骤包括:随机选取多个不同的所述目标样本,并将选取出的目标样本作为聚类中心;计算每个目标样本分别到每个聚类中心的距离,遍历所有所述目标样本,根据距离计算结果将每个所述目标样本分配到距离最近的聚类中心以形成样本簇。4.根据权利要求2所述的意图分类方法,其特征在于,重复执行从所述样本簇中随机选取一个样本簇,每次从选取出的样本簇中随机选取多个不同的子样本并获取各个子样本的中心,将所述中心作为新的目标样本直至新的目标样本的数量达到所述目标样本需均衡的数量为止的步骤包括:从所述样本簇中随机选取一个样本簇,从选取出的样本簇中随机选取多个不同的子样本并计算各个子样本加权平均值;将所述加权平均值与样本中心进行关联,将所述样本中心作为新的目标样本;重复执行生成新的目标样本的步骤以获取多个新的目标样本直至新的目标样本的数量达到所述目标样本需均衡的数量为止。5.根据权利要求1所述的意图分类方法,其特征在于,将训练样本集分批输入预构建好的意图分类模型中,获得每个训练样本的预测结果,根据所述预测结果计算每个训练样本的梯度模长,根据所有所述梯度模长划分梯度区间,按照所述梯度区间对所述训练样本进行分类处理并根据分类处理结果计算梯度区间密度,根据所述梯度区间密度计算损失函数,采用所述损失函数对所述意图分类模型进行训练,得到目标意图分类模型的步骤包括:2CN113704413A权利要求书2/3页将训练样本集分批输入预构建好的意图分类模型中,获得每个训练样本的预测结果,根据每个训练样本的标注处理