预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN114611668A(43)申请公布日2022.06.10(21)申请号202210230949.5(22)申请日2022.03.10(71)申请人浙江农林大学地址311300浙江省杭州市临安区武肃街666号(72)发明人楼晓俊李剑张天荣冯海林(74)专利代理机构杭州求是专利事务所有限公司33200专利代理师陈升华(51)Int.Cl.G06N3/04(2006.01)权利要求书2页说明书6页附图1页(54)发明名称一种基于异质信息网络随机游走的向量表示学习方法及系统(57)摘要本发明公开了一种基于异质信息网络随机游走的向量表示学习方法及系统,包括:多次随机游走获得多个元路径实例,挑选k条元路径实例;对k条的元路径实例中包含的节点进行维度统一,获得该节点的特征向量表示;输入到biLSTM网络,学习到元路径实例的向量表示;输入注意力层,先学习到每一条元路径实例对于节点的影响因子,然后通过注意力机制将影响因子和元路径实例的向量进行聚合,得到节点的嵌入向量表示;将节点的嵌入向量,输入到损失函数中,得到损失值,通过优化器多次优化,得到最终的节点向量。本发明可以在链路预测、节点分类、节点聚类以及推荐的任务上取得很好的效果。CN114611668ACN114611668A权利要求书1/2页1.一种基于异质信息网络随机游走的向量表示学习方法,其特征在于,包括以下步骤:1)异质信息网络预处理构造多个三元组;2)多次随机游走获得多个元路径实例,挑选k条元路径实例;3)对步骤2)获得k条的元路径实例中包含的节点进行维度统一,获得该节点的特征向量表示;4)将步骤3)获得的节点的特征向量输入到biLSTM网络,学习到元路径实例的向量表示;5)将步骤4)获得的元路径实例的向量输入注意力层,先学习到每一条元路径实例对于节点的影响因子,然后通过注意力机制将影响因子和步骤4)获得的元路径实例的向量进行聚合,得到节点的嵌入向量表示;6)将步骤5)获得的节点的嵌入向量,输入到损失函数中,得到损失值,通过优化器多次优化,得到最终的节点向量。2.根据权利要求1所述的基于异质信息网络随机游走的向量表示学习方法,其特征在于,步骤1)中,所述的预处理包括:通过随机负采样的方式构造多个三元组,所述的三元组包括:目标节点、正样本节点、负样本节点。3.根据权利要求1所述的基于异质信息网络随机游走的向量表示学习方法,其特征在于,步骤2)中,多次随机游走获得多个元路径实例,挑选k条元路径实例,具体包括:2.1)从异质信息网络三元组的节点开始随机游走,当游走到和开始节点类型相同,停止这一次的随机游走,并记录该元路径实例;2.2)重复步骤2.1),得到多个元路径实例;2.3)从步骤2.2)中的多个元路径实例挑选k条;4.根据权利要求3所述的基于异质信息网络随机游走的向量表示学习方法,其特征在于,步骤2.2)中,多个元路径实例为200~2000个。5.根据权利要求3所述的基于异质信息网络随机游走的向量表示学习方法,其特征在于,步骤2.3)中,k为3~10。6.根据权利要求3所述的基于异质信息网络随机游走的向量表示学习方法,其特征在于,步骤2.3)中,挑选包括:从出现频率中从高到低挑选出最高的k条。7.根据权利要求1所述的基于异质信息网络随机游走的向量表示学习方法,其特征在于,步骤3)中,维度统一包括:将具有不同长度和不同特征的节点映射到相同的语义空间。8.根据权利要求1所述的基于异质信息网络随机游走的向量表示学习方法,其特征在于,步骤4)中,学习公式为:v1,v2,v3∈PF=concat(f(v1),f(v2),f(v3))其中,(v1,v2,v3)代表了元路径实例P上的节点,f(v1)、f(v2)、f(v3)代表了节点的特征向量,concat为拼接函数,F为拼接后的向量,LSTM为一种神经网络结构,embedding为学习得到的元路径实例向量表示。2CN114611668A权利要求书2/2页9.一种基于异质信息网络随机游走的向量表示学习系统,其特征在于,包括:元路径采集模块,用于从异质信息网络三元组的节点开始随机游走到和开始节点类型相同,记录该元路径实例,重复得到多个元路径实例,从多个元路径实例挑选k条;节点特征聚合模块,用于对k条的元路径实例中包含的节点进行维度统一获得该节点的特征向量表示;元路径实例聚合模块,用于将节点的特征向量输入到biLSTM网络,学习到元路径实例的向量表示;注意力层模块,用于将获得的元路径实例的向量输入注意力层,先学习到每一条元路径实例对于节点的影响因子,然后通过注意力机制将影响因子和元路径实例的向量进行聚合,得到节点的嵌入向量表示。3CN114611668A说明书1/6页一种基于异质信息网络随