预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共19页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113656558A(43)申请公布日2021.11.16(21)申请号202110980623.XG06N20/00(2019.01)(22)申请日2021.08.25(71)申请人平安科技(深圳)有限公司地址518000广东省深圳市福田街道福安社区益田路5033号平安金融中心23楼(72)发明人蒋雪涵(74)专利代理机构北京中强智尚知识产权代理有限公司11448代理人贾依娇(51)Int.Cl.G06F16/33(2019.01)G06F16/335(2019.01)G06F16/35(2019.01)G06F40/126(2020.01)G06F40/194(2020.01)权利要求书2页说明书12页附图4页(54)发明名称基于机器学习对关联规则进行评估的方法及装置(57)摘要本发明涉及人工智能技术领域,揭露一种基于机器学习对关联规则进行评估的方法,包括:使用项目共现条件从项目集合中挖掘关联规则,关联规则包括前件和后件,项目共现条件为前件与后件中项目同时出现;利用预先训练的文本信息编码器和前件预测机对收集的项目文本信息进行特征提取,得到项目文本信息的编码向量表示,文本信息编码器用于对关联规则中后件是否出现进行预测,前件预测机用于对关联规则中前件是否出现进行预测;响应于关联规则的评估指令,根据项目文本信息的编码向量表示对每条关联规则进行评估,得到反映关联规则中前件和后件之间因果关系的评估结果。本发明能够针对关联规则进行因果关系评估,提高关联规则的可解释性。CN113656558ACN113656558A权利要求书1/2页1.一种基于机器学习对关联规则进行评估的方法,其特征在于,所述方法包括:使用项目共现条件从项目集合中挖掘关联规则,所述关联规则包括前件和后件,所述项目共现条件为前件和后件中项目同时出现;利用预先训练的文本信息编码器和前件预测机对收集的项目文本信息进行特征提取,得到项目文本信息的编码向量表示,所述文本信息编码器用于对所述关联规则中后件是否出现进行预测,所述前件预测机用于对所述关联规则中前件是否出现进行预测;响应于关联规则的评估指令,根据所述项目文本信息的编码向量表示对每条关联规则进行评估,得到反映关联规则中前件和后件之间因果关系的评估结果。2.根据权利要求1所述的方法,其特征在于,所述项目共现条件为关联规则中前件与后件同时出现,所述使用项目共现条件从项目集合中挖掘关联规则,具体包括:对项目集合所包含频繁项目子集进行全排列;针对所述频繁项目子集生成候选关联规则,并利用预设参数指标对所述候选关联规则进行过滤,得到符合预设条件的候选规则,所述参数指标至少包括支持度和置信度,所述支持度为前件和后件的共现频率,所述置信度为支持度与前件概率的比值。3.根据权利要求1所述的方法,其特征在于,在所述利用预先训练的文本信息编码器和前件预测机对收集的项目文本信息进行特征提取,得到项目文本信息的编码向量表示之前,所述方法还包括:针对每条关联规则,使用预先确定所述前件和所述后件是否在项目文本信息中出现作为标签数据;将携带有标签数据的项目文本信息输入至第一网络模型中进行训练,构建文本信息编码器,所述文本信息编码器的优化目标为最大化预测关联规则中后件是否在项目文本信息中出现;将所述第一网络模型输出项目文本信息的编码向量表示以及关联规则中后件是否在项目文本信息中出现的预测值输入至第二网络模型进行训练,构建前件预测机,所述前件预测机的优化目标为最大化预测关联规则中前件是否在项目文本信息中出现。4.根据权利要求3所述的方法,其特征在于,所述文本信息编码器与所述前件预测机在训练过程中进行对抗学习,以使得项目文本信息中去除与关联规则中前件相关的信息,并保留关联规则中前件与后件相关的信息。5.根据权利要求1‑4中任一项所述的方法,其特征在于,所述根据所述项目文本信息的编码向量表示对每条关联规则进行评估,得到反映关联规则中前件和后件之间因果关系的评估结果,具体包括:针对每条关联规则,根据所述项目文本信息的编码向量表示计算反映关联规则中前件和后件之间因果关系的评估数值;若所述评估数值大于预设阈值,则判定所述关联规则中前件和后件之间具有因果关系。6.根据权利要求5所述的方法,其特征在于,所述项目文本信息包含有多个文本,所述针对每条关联规则,根据所述项目文本信息的编码向量表示计算反映关联规则中前件和后件之间因果关系的评估数值,具体包括:针对每条关联规则,从所述项目文本信息中选取关联规则中前件出现的文本作为样本2CN113656558A权利要求书2/2页文本;遍历项目文本信息的编码向量表示,查询与每个样本文本的编码向量表示符合相似度条件的文本,作为每个样本文本的相似目标文本;针对每