预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共18页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN114154072A(43)申请公布日2022.03.08(21)申请号202111502498.8(22)申请日2021.12.08(71)申请人北京度友信息技术有限公司地址100085北京市海淀区上地东路1号院4号楼2层219(72)发明人解珍杨熙武光蕊(74)专利代理机构中科专利商标代理有限责任公司11021代理人吴晓兵(51)Int.Cl.G06F16/9535(2019.01)G06F16/31(2019.01)G06F16/33(2019.01)权利要求书3页说明书10页附图4页(54)发明名称检索方法、装置、电子设备以及存储介质(57)摘要本公开提供了一种检索方法、装置、电子设备、存储介质以及程序产品,涉及人工智能技术领域,尤其涉及云计算、大数据等技术领域。具体实现方案为:针对检索信息,确定与检索信息相对应的数据源;确定与数据源相对应的目标数据集合;以及从目标数据集合中,确定与检索信息相匹配的目标数据。CN114154072ACN114154072A权利要求书1/3页1.一种检索方法,包括:针对检索信息,确定与所述检索信息相对应的数据源;确定与所述数据源相对应的目标数据集合;以及从所述目标数据集合中,确定与所述检索信息相匹配的目标数据。2.根据权利要求1所述的方法,其中,所述从所述目标数据集合中确定与所述检索信息相匹配的目标数据包括:按照倒排索引方式,从所述目标数据集合中确定与所述检索信息相匹配的目标数据。3.根据权利要求2所述的方法,其中,所述按照倒排索引方式,从所述目标数据集合中确定与所述检索信息相匹配的目标数据包括:按照预定分词规则对所述检索信息进行切分,生成至少一个检索子信息;按照所述倒排索引方式,基于倒排索引表,从所述目标数据集合中确定与所述至少一个检索子信息相匹配的至少一个检索数据;以及从所述至少一个检索数据中确定所述目标数据。4.根据权利要求3所述的方法,还包括:通过将数据集合按照键值存储方式进行存储,生成所述倒排索引表,以便基于所述倒排索引表,从所述数据集合中确定与所述数据源相对应的所述目标数据集合,其中,所述倒排索引表包括以下至少一项:所述数据集合中的至少一个数据各自的数据源标识、所述至少一个数据各自的存储位置信息、与所述至少一个数据各自一一对应的至少一个数据子标识集合。5.根据权利要求4所述的方法,还包括:确定所述数据集合中的至少一个数据各自的数据源标识;确定所述数据集合中的至少一个数据各自的存储位置信息;按照预定分词规则对所述至少一个数据各自的数据标识进行切分,生成与所述至少一个数据各自一一对应的至少一个数据子标识集合;以及基于所述数据源标识、存储位置信息以及所述至少一个数据子标识集合,生成所述倒排索引表。6.根据权利要求3所述的方法,其中,所述按照所述倒排索引方式,基于倒排索引表,从所述目标数据集合中确定与所述至少一个检索子信息相匹配的至少一个检索数据包括:针对所述至少一个检索子信息中的每个检索子信息,基于所述倒排索引表,从所述至少一个数据子标识集合中确定与所述检索子信息相匹配的至少一个数据子标识,生成数据子标识子集合;以及基于所述倒排索引表中的存储位置信息,对所述数据子标识子集合中的数据子标识进行交集处理,从所述目标数据集合中确定与所述至少一个检索子信息相匹配的至少一个检索数据。7.根据权利要求3所述的方法,其中,所述从所述至少一个检索数据中确定所述目标数据包括:响应于第一检索指令,按照字符串匹配规则从所述至少一个检索数据中确定所述目标数据,其中,所述目标数据的数据标识与所述检索信息之间符合所述字符串匹配规则;以及响应于第二检索指令,按照相似度匹配规则从所述至少一个检索数据中确定所述目标2CN114154072A权利要求书2/3页数据,其中,所述目标数据的数据标识与所述检索信息之间符合所述相似度匹配规则。8.根据权利要求3或5所述的方法,其中,所述预定分词规则包括以下至少一项:以中文字为单位进行切分、以英文单词为单位进行切分、以字符串为单位进行切分。9.一种检索装置,包括:第一确定模块,用于针对检索信息,确定与所述检索信息相对应的数据源;第二确定模块,用于确定与所述数据源相对应的目标数据集合;以及第三确定模块,用于从所述目标数据集合中,确定与所述检索信息相匹配的目标数据。10.根据权利要求9所述的装置,其中,所述第三确定模块包括:倒排索引子模块,用于按照倒排索引方式,从所述目标数据集合中确定与所述检索信息相匹配的目标数据。11.根据权利要求10所述的装置,其中,所述倒排索引子模块包括:切分单元,用于按照预定分词规则对所述检索信息进行切分,生成至少一个检索子信息;第一确定单元,用于按照所述倒排索引方式,基于倒排索