预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共13页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113918684A(43)申请公布日2022.01.11(21)申请号202111241094.8(22)申请日2021.10.25(71)申请人咪咕文化科技有限公司地址100032北京市西城区德胜门外大街11号5幢400室(德胜园区)申请人中国移动通信集团有限公司(72)发明人孙玲李琳(74)专利代理机构北京市浩天知识产权代理事务所(普通合伙)11276代理人梁倩(51)Int.Cl.G06F16/33(2019.01)G06F16/335(2019.01)G06F16/383(2019.01)权利要求书2页说明书8页附图2页(54)发明名称一种信息搜索方法、装置及设备(57)摘要本发明公开了一种信息搜索方法、装置及设备,该方法包括:获取用于搜索文档的目标关键词;将所述目标关键词包含的关键字输入布隆过滤器,以从文档集合中,筛选与所述关键字的布隆索引相对应的第一文档集合;基于所述目标关键词,对所述第一文档集合进行搜索,以得到包含所述目标关键词的第二文档集合。通过上述方式,本发明的方案可以有效提升搜索速度,缩短搜索时长。CN113918684ACN113918684A权利要求书1/2页1.一种信息搜索方法,其特征在于,所述方法包括:获取用于搜索文档的目标关键词;将所述目标关键词包含的关键字输入布隆过滤器,以从文档集合中,筛选与所述关键字的布隆索引相对应的第一文档集合;基于所述目标关键词,对所述第一文档集合进行搜索,以得到包含所述目标关键词的第二文档集合。2.根据权利要求1所述的信息搜索方法,其特征在于,所述布隆过滤器,通过以下过程优化得到:获取历史搜索关键词;从所述历史搜索关键词中,确定存在相关性的关键字;根据所述关键字,优化布隆过滤器,以得到优化后的布隆过滤器。3.根据权利要求2所述的信息搜索方法,其特征在于,从所述历史搜索关键词中,确定存在相关性的关键字,包括:根据不同关键字同时出现在同一历史搜索关键词中的次数与预设阈值,从所述历史搜索关键词中,确定存在相关性的关键字。4.根据权利要求2所述的信息搜索方法,其特征在于,根据所述关键字,优化布隆过滤器,以得到优化后的布隆过滤器,包括:对存在相关性的关键字形成的关键字相关性列表进行遍历,若遍历的当前关键字的相关关键字不在记录字典中,在所述记录字典中增加记录,所述记录包括当前关键字以及该当前关键字在布隆索引中的位置;若遍历的当前关键字的相关关键字在记录字典中,确定当前关键字在所述关键字相关性列表中的位置;根据所述当前关键字在所述关键字相关性列表中的位置,与所述记录字典中已有相关关键字的位置不重复,在所述记录字典中增加记录;若所述当前关键字在所述关键字相关性列表中的位置,与所述记录字典中已有相关关键字的位置重复,根据上次确定的所述当前关键字在所述关键字相关性列表中的位置进行计算,直到确定出的所述当前关键字在所述关键字相关性列表中的位置,与所述记录字典中已有相关关键字的位置不重复;根据所述关键字相关性列表中的所有关键字的位置,形成第一版本记录字典;遍历搜索文档中的当前字为所述关键字相关性列表中的字,依据所述记录字典表中的该当前字和布隆索引位置对应关系,标记该当前字的布隆索引;否则,直接对该当前字进行编码转换取余得到取余结果,根据该取余结果设置该当前字的布隆索引;根据所述搜索文档中的每个字的布隆索引,得到优化后的布隆过滤器。5.根据权利要求2所述的信息搜索方法,其特征在于,得到优化后的布隆过滤器后,还包括:获得新增加的搜索文档的关键字相关性列表;根据所述新增加的搜索文档的关键字相关性列表,对所述第一版本记录字典进行更新,得到更新后的第二版本记录字典;根据所述新增加的搜索文档以及所述更新后的第二记录字典,得到所述新增加的搜索2CN113918684A权利要求书2/2页文档的布隆索引;根据所述新增加的搜索文档的布隆索引对优化后的布隆过滤器进行更新,得到更新后的布隆过滤器。6.根据权利要求1所述的信息搜索方法,其特征在于,获取用于搜索文档的目标关键词,包括:获取用户输入的用于搜索文档的搜索关键词集合;对所述待搜索关键词集合进行过滤,得到目标关键词。7.根据权利要求6所述的信息搜索方法,其特征在于,将所述目标关键词包含的关键字输入布隆过滤器,以从文档集合中,筛选与所述关键字的布隆索引相对应的第一文档集合,包括:将所述目标关键词包含的关键字输入布隆过滤器,若所述目标关键词包含的关键字的布隆索引在所述布隆过滤器中的布隆索引中,则将所述目标关键词包含的关键字的布隆索引对应的文档形成的文档集合,作为所述第一文档集合。8.一种信息搜索装置,其特征在于,所述装置包括:获取模块,用于获取用于搜索文档的目标关键词;处理模块,用于将所