预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共18页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN110555139A(43)申请公布日2019.12.10(21)申请号201910811802.3(22)申请日2019.08.30(71)申请人南开大学地址300071天津市南开区卫津路94号(72)发明人宋春瑶郭佳雯袁晓洁(74)专利代理机构天津耀达律师事务所12223代理人侯力(51)Int.Cl.G06F16/901(2019.01)权利要求书3页说明书9页附图5页(54)发明名称基于节点签名的保留标签信息的异质网络嵌入方法(57)摘要一种基于节点签名的保留标签信息的异质网络嵌入方法。网络嵌入是将高维的图数据映射到低维向量,以解决高维图数据无法有效利用机器学习算法进行数据分析的一种方法。本发明方法具体包括:对网络中所有标签类型进行质数字典映射;提取网络节点的邻域标签集;构建节点签名向量;构建网络节点表示。本发明旨在综合利用异质图的网络结构、语义和标签信息,以数字签名的思想和质数的特性,构建异质图的网络表示学习框架,实现异质图上网络节点和边标签信息的保留,并根据学习到的异质网络节点表示进行后续节点聚类、分类、链路预测等机器学习任务,能够普适性地对现有同质及异质网络嵌入方法进行扩展和提升。CN110555139ACN110555139A权利要求书1/3页1.一种基于节点签名的保留标签信息的异质网络嵌入方法,该方法以数字签名的思想为基础,构建出的节点签名向量可以在使用现有同质或异质网络嵌入方法保留图拓扑结构信息的基础上进行普适性地扩展和提升,保留原始图上点和边的标签信息,达到提升下游各项通用机器学习任务的准确度的目的,同时对独立边标签信息的保留提升了异质网络嵌入中边标签的灵活度,能够适应边标签分类的特殊需求;具体步骤如下:第1、对网络中所有的标签类型进行质数字典映射;第1.1、确定网络中所有的节点标签和边标签类型;第1.2、根据标签类型建立质数映射字典;第2、提取网络节点的邻域标签集;第2.1、确定节点的邻域集合;第2.2、根据质数映射字典确定节点的邻域标签集合;第3、构建节点签名向量;第3.1、根据节点的邻域标签集计算节点签名;第3.2、根据单维签名上限对溢出部分进行维度划分;第3.3、根据最长维度对多维节点签名进行维度补齐;第3.4、根据签名维度要求进行签名向量降维;第3.5、对降维后的签名向量进行标准化处理;第4、根据维度要求和选定基础方法构建网络节点最终向量表示;第4.1、根据节点表示的总维度和签名占比要求生成指定维度的节点基础向量;第4.2、融合基础向量和签名向量构建网络节点最终向量表示。2.根据权利要求1所述的方法,其特征在于第1步所述的对标签类型进行质数字典映射的方法是:利用质数的特性来区别不同类型的标签信息,使得边标签在不依赖节点标签语义的基础上,保留独立的语义信息,并在保留多个标签信息时对标签的内容进行区分;第1.1、确定网络中所有的节点标签和边标签类型;给定输入数据图中的节点标签类型总数为nv,边标签类型总数为ne,标签类型表示为[l1,l2,…,lnv,lnv+1,lnv+2,…,lnv+ne];对于未知标签类型信息的网络,通过对数据进行统计,得出网络中全部的不同标签类型;第1.2、根据标签类型建立质数映射字典;将不同类型的标签类型一一对应地映射到生成的自小到大的nv+ne个质数上,采用字典结构f(l)保留标签和质数的映射关系。3.根据权利要求2所述的方法,其特征在于第2步所述的提取网络节点的邻域标签集分为两种情况,分别是提取网络节点的直连邻域标签集和提取网络节点的自我中心网络标签集,具体方法如下:(1)提取网络节点的直连邻域标签集节点的直连邻域是指,当前节点和与当前节点连接的所有边,以及与当前节点直接相连的所有节点;节点的直连邻域标签集即为节点直连邻域中所有节点和边上的标签信息;针对不同领域的异质网络数据,考虑节点直连邻域中的标签信息包含了与当前节点相关的节点标签语义及其之间关系类型的语义,能够对各类网络语义相似性进行通用的考虑;2CN110555139A权利要求书2/3页给定输入数据图的边集为E,点集为V,e(i,j)表示节点i与节点j之间的边,当前节点v的直连邻域节点集表示为邻域边集表示为则:v的直连邻域表示为N1(v),则:对得到的节点邻域集合中的每个节点或边x上的标签l(x),根据权利要求1中确定的质数映射字典f(l)进行节点标签和边标签的质数转化,得到直连邻域的标签集合P1(v),则:P1(v)={p|p=f(l(x)),x∈N1(v)};(2)提取网络节点的自我中心网络标签集节点的自我中心网络是指,当前节点、当前节点上所有的边和与当前节点直接相连的所有节点,以及这些节点之间互相连接的边;节点的自我中心网络标签集