预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共30页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN115905309A(43)申请公布日2023.04.04(21)申请号202211736332.7(51)Int.Cl.(22)申请日2022.12.30G06F16/2453(2019.01)G06F16/2458(2019.01)(71)申请人奇安信网神信息技术(北京)股份有G06F16/28(2019.01)限公司地址100044北京市西城区西直门外南路26号院1号楼2层申请人奇安信科技集团股份有限公司北京天广汇通科技有限公司(72)发明人束博王占一刘昱均万鸣席卓田亮杨舒张晓峰曲君国(74)专利代理机构北京维飞联创知识产权代理有限公司11857专利代理师逯恒权利要求书3页说明书18页附图8页(54)发明名称相似实体搜索方法、装置、计算机设备及可读存储介质(57)摘要本发明提供的相似实体搜索方法、装置、计算机设备及可读存储介质,方法包括:从获取图数据的中提取行为路径集合;从行为路径集合中提取待搜索实体关联的目标行为路径;待搜索实体是行为关联对象、行为或者由至少一个行为关联对象和至少一个行为构成;根据目标行为路径,生成待搜索实体的行为特征向量;基于行为特征向量,确定实体数据库中与待搜索实体之间的相似度满足预设条件的目标实体。本发明方案中的待搜索实体可以是行为关联对象、行为或者是由至少一个行为关联对象和至少一个行为构成,也就是子图或者整张图,扩大了搜索范围,本发明实将图结构信息映射到转换为特征向量,利用向量相似度确定相似实体,降低了计算复杂度,提高了搜索效率。CN115905309ACN115905309A权利要求书1/3页1.一种相似实体搜索方法,其特征在于,所述方法包括:获取图数据,并从所述图数据中提取行为路径集合;其中,所述图数据是依据行为关联对象之间的行为关系生成的;所述图数据包括行为节点和行为方向线的属性数据,所述行为节点表征所述行为关联对象;所述行为方向线表征行为;行为路径是根据所述行为关联对象之间产生的具有先后顺序的所述行为形成;从所述行为路径集合中提取待搜索实体关联的目标行为路径;其中,所述待搜索实体是所述行为关联对象、所述行为或者由至少一个所述行为关联对象和至少一个所述行为构成;根据所述目标行为路径生成所述待搜索实体的行为特征向量;基于所述行为特征向量,确定实体数据库中与所述待搜索实体之间的相似度满足预设条件的目标实体。2.根据权利要求1所述的方法,其特征在于,获取图数据,并从所述图数据中提取行为路径集合,包括:针对任意两个所述行为节点,沿所述行为方向线的方向,提取任意两个所述行为节点之间的全部行为节点和全部行为方向线,组成一条所述行为路径;提取路径长度在预设长度范围内的全部所述行为路径并去重,得到所述行为路径集合。3.根据权利要求1所述的方法,其特征在于,当所述待搜索实体为所述行为关联对象,从所述行为路径集合中提取待搜索实体关联的目标行为路径,包括:从所述行为路径集合中,提取以所述待搜索实体为起点且路径长度小于或等于最大长度阈值的行为路径,作为所述目标行为路径。4.根据权利要求1所述的方法,其特征在于,当所述待搜索实体为所述图数据的子图,从所述行为路径集合中提取待搜索实体关联的目标行为路径,包括:从所述图数据中确定出至少一个目标行为节点和至少一个目标行为方向线;根据所述目标行为节点之间关联的所述目标行为方向线,构建所述子图;在所述子图中,针对任意两个所述目标行为节点,沿所述目标行为方向线的方向,提取任意两个所述目标行为节点之间的全部目标行为节点和全部目标行为方向线,组成一条所述目标行为路径;剔除路径长度不在预设长度范围内的所述目标行为路径并去重,得到所述子图对应的目标行为路径。5.根据权利要求1所述的方法,其特征在于,当所述待搜索实体为所述行为,从所述行为路径集合中提取待搜索实体关联的目标行为路径,包括:确定所述待搜索实体关联的两个目标行为节点,并从所述行为路径集合中,提取以每个所述目标行为节点为起点且路径长度小于或等于最大长度阈值与预设值之差的行为路径,作为所述目标行为路径。6.根据权利要求1所述的方法,其特征在于,根据所述目标行为路径生成所述待搜索实体的行为特征向量,包括:根据预设长度范围提取每条所述目标行为路径包含的全部子路径;将每条所述子路径中的每个路径节点转换成行为属性字符串序列;2CN115905309A权利要求书2/3页其中,所述路径节点为所述行为关联对象和所述行为方向线;所述行为属性字符串序列中的每个所述行为属性字符串由所述路径节点对应的属性名称、属性值和位置序号组成;将每条所述子路径对应的行为属性字符串序列进行向量转换,得到每条所述子路径对应的预设维度的向量;将全部所述向量逐位相加得到所述目标行为路径的行为特征向量。7.根据