预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共18页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN116010709A(43)申请公布日2023.04.25(21)申请号202310120909.XG06F16/31(2019.01)(22)申请日2023.02.14(71)申请人拉扎斯网络科技(上海)有限公司地址200333上海市普陀区真北路788号507室(72)发明人苑爱泉曹国栋潘伟张鹏郭轶博刘传宝(74)专利代理机构北京博思佳知识产权代理有限公司11415专利代理师王茹(51)Int.Cl.G06F16/9535(2019.01)G06Q30/0601(2023.01)G06F16/36(2019.01)G06F16/35(2019.01)权利要求书2页说明书11页附图4页(54)发明名称数据处理方法、搜索方法、装置及设备(57)摘要本说明书实施例提供了一种数据处理方法、搜索方法、装置及设备。在获取到一个或者多个预先构建的知识图谱后,可以根据不同使用场景对知识的需求,对这些知识图谱中的知识进行加工处理,得到适用于不同使用场景的多个数据表,后续针对不同的使用场景,可以利用该使用场景对应的数据表进行相关业务的处理。由于对知识图谱进行加工处理的过程中可以按照统一的分类标准对知识进行分类,从而可以避免知识分散、凌乱的问题。同时,不同数据表中存储的数据的数据结构是基于不同使用场景对知识的需求设置的,因而,在将这些数据表应用到不同的使用场景时,既可以提升处理效率,也可以得到更加准确的处理结果。CN116010709ACN116010709A权利要求书1/2页1.一种数据处理方法,所述方法包括:获取一个或多个知识图谱;对所述一个或多个知识图谱中的知识进行分类,将所述知识划分到预先设置的多个类别中;基于各知识所属的类别以及各知识之间的关联关系构建得到多个数据表,其中,每个数据表中存储的数据的数据结构基于该数据表对应的使用场景标签设置,不同的数据表中存储的数据用于从不同维度描述知识的特性。2.根据权利要求1所述的方法,所述多个数据表用于商品搜索场景或商品推荐场景,所述预先设置的多个类别包括以下一种或多种:类目、实体、属性、场景标签、商品、店铺、指定店铺的主营品。3.根据权利要求1所述的方法,所述在基于各知识所属的类别以及各知识之间的关联关系构建得到多个数据表后,所述方法还包括:针对每个数据表,对该数据表中存储的各条数据进行质量检测;针对任一条数据,若该条数据不满足预设的质量条件,则删除该条数据。4.根据权利要求3所述的方法,所述对该数据表中存储的各条数据进行质量检测包括以下一项或多项:检测各条数据描述的不同知识之间的关联关系的准确性;检测各条数据描述的知识分类结果的准确性;检测数据表中存储的数据对指定类型的知识的覆盖率。5.根据权利要求3所述的方法,所述数据表中存储的各条数据用于描述两个知识的相关性;所述对该数据表中存储的各条数据进行质量检测,包括:将每条数据输入至预先训练的质量检测模型,基于质量检测模型输出质量检测结果;其中,所述质量检测模型基于以下方式训练得到:重复以下步骤,直至满足预设条件:针对原始知识图谱中的任一节点,获取该节点的相邻节点,与该节点构成正样本对,以及获取与该节点不存在连接边的节点,与该节点构成负样本对;利用构建的正样本对和负样本对对预设的初始模型进行训练;将所述数据表中的各条数据输入到训练后的初始模型中,基于训练后的初始模型的预测结果,将所述各条数据中的知识更新到所述原始知识图谱中,得到更新后的知识图谱,并执行从更新后的知识图谱获取正样本对和负样本对的步骤。6.一种搜索方法,所述方法包括:获取关键词;从预先构建的多个数据表中确定和当前的使用场景匹配的目标数据表,基于所述目标数据表确定和所述关键词相关联的目标对象,以将所述目标对象展示给用户;其中,所述多个数据表根据如权利要求1‑5任一项所述的数据处理方法构建。7.一种数据处理装置,所述装置包括:获取模块,用于获取一个或多个知识图谱;分类模块,用于对所述一个或多个知识图谱中的知识进行分类,将所述知识划分到预先设置的多个类别中;2CN116010709A权利要求书2/2页数据表构建模块,用于基于各知识所属的类别以及各知识之间的关联关系构建得到多个数据表,其中,每个数据表中存储的数据的数据结构基于该数据表对应的使用场景标签设置,不同的数据表中存储的数据用于从不同维度描述知识的特性。8.一种搜索装置,所述装置包括:获取模块,用于获取关键词;搜索模块,用于从预先构建的多个数据表中确定和当前的使用场景匹配的目标数据表,基于所述目标数据表确定和所述关键词相关联的目标对象,以将所述目标对象展示给用户;其中,所述多个数据表根据如权利要求1‑5任一项所述的数据处理方法构建。9.一种电子设备,所述设备包括:存储器,用于