预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共17页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN115758150A(43)申请公布日2023.03.07(21)申请号202211464762.8(22)申请日2022.11.22(71)申请人中国农业银行股份有限公司地址100005北京市东城区建国门内大街69号(72)发明人王盟阎翠婷王博(74)专利代理机构北京同立钧成知识产权代理有限公司11205专利代理师贺财俊刘芳(51)Int.Cl.G06F18/214(2023.01)G06F18/2415(2023.01)G06F18/2113(2023.01)权利要求书2页说明书10页附图4页(54)发明名称数据处理方法、装置、设备、存储介质及程序产品(57)摘要本申请实施例提供一种数据处理方法、装置、设备、存储介质及程序产品,本申请实施例涉及数据处理技术领域,该方法包括:根据训练样本集,通过无监督学习模型,得到本轮迭代结果;所述训练样本集为语料样本集或图像样本集;对所述本轮迭代结果中分类存储的数据样本进行特征筛选,得到新的分类存储的数据样本;根据所述本轮迭代结果,调整所述无监督学习模型的参数,并将所述新的分类存储的数据样本,通过本轮调整后的无监督学习模型进行下一轮迭代操作,直至达到迭代停止条件;其中,训练好的无监督学习模型用于语音识别或图像识别。本申请实例提供的方法能够克服现有技术的模式识别中,无监督学习的方式存在机器学习的效率及准确度较低的问题。CN115758150ACN115758150A权利要求书1/2页1.一种数据处理方法,其特征在于,所述方法包括:根据训练样本集,通过无监督学习模型,得到本轮迭代结果;所述训练样本集为语料样本集或图像样本集,所述本轮迭代结果用于表示本轮对所述训练样本集中的训练样本进行分类存储的数据样本;对所述本轮迭代结果中分类存储的数据样本进行特征筛选,得到新的分类存储的数据样本;根据所述本轮迭代结果,调整所述无监督学习模型的参数,并将所述新的分类存储的数据样本,通过本轮调整后的无监督学习模型进行下一轮迭代操作,直至达到迭代停止条件;其中,训练好的无监督学习模型用于语音识别或图像识别。2.根据权利要求1所述的方法,其特征在于,所述对所述本轮迭代结果中分类存储的数据样本进行特征筛选,得到新的分类存储的数据样本,包括:根据所述本轮迭代结果中分类存储的数据样本,确定各个类中多个支持向量;根据各个类中多个支持向量,确定各个类的代表特征;根据各个类的代表特征,对所述本轮迭代结果中分类存储的数据样本进行特征筛选,得到新的分类存储的数据样本。3.根据权利要求2所述的方法,其特征在于,所述根据所述本轮迭代结果,调整所述无监督学习模型的参数,包括:根据所述本轮迭代结果,通过最小化重构误差的准则,调整所述无监督学习模型的参数,使得本轮迭代相对于上一轮迭代结果收敛。4.根据权利要求1‑3任一项所述的方法,其特征在于,所述方法还包括:获取源数据,所述源数据为原始语料数据或原始图像数据;对所述原始语料数据或所述原始图像数据依次进行整理、筛选和整合,得到过滤后的数据;对所述过滤后的数据进行缺失值补充,得到训练样本集;其中,若所述源数据为原始语料数据,则训练样本集为语料样本集;若所述源数据为原始图像数据,则训练样本集为图像样本集。5.根据权利要求1‑3任一项所述的方法,其特征在于,若所述训练好的无监督学习模型用于语音识别;所述方法还包括:获取待识别的语音数据;将所述待识别的语音数据输入到所述训练好的无监督学习模型中,通过将提取的语音特征与存储的数据样本进行比对,输出目标语音数据。6.根据权利要求1‑3任一项所述的方法,其特征在于,若所述训练好的无监督学习模型用于图像识别;所述方法还包括:获取待识别的图像数据;将所述待识别的图像数据输入到所述训练好的无监督学习模型中,通过将提取的图像特征与存储的数据样本进行比对,输出目标图像数据。7.一种数据处理装置,其特征在于,所述装置包括:第一处理模块,用于根据训练样本集,通过无监督学习模型,得到本轮迭代结果;所述2CN115758150A权利要求书2/2页训练样本集为语料样本集或图像样本集,所述本轮迭代结果用于表示本轮对所述训练样本集中的训练样本进行分类存储的数据样本;特征筛选模块,用于对所述本轮迭代结果中分类存储的数据进行特征筛选,得到新的分类存储的数据样本;第二处理模块,用于根据所述本轮迭代结果,调整所述无监督学习模型本轮的参数,并将所述新的分类存储的数据样本,通过本轮调整后的无监督学习模型进行下一轮迭代操作,直至达到迭代停止条件;其中,训练好的无监督学习模型用于语音识别或图像识别。8.一种电子设备,其特征在于,包括:至少一个处理器和存储器;所述存储器存储计算机执行指令;所述至少一个处理器执行所述存储器存储的计算机执行