预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共22页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN114238782A(43)申请公布日2022.03.25(21)申请号202111529143.8(22)申请日2021.12.14(71)申请人北京达佳互联信息技术有限公司地址100089北京市海淀区上地西路6号1幢1层101D1-7(72)发明人李宣平袁勇(74)专利代理机构北京康信知识产权代理有限责任公司11240代理人黄海英(51)Int.Cl.G06F16/9536(2019.01)G06F16/906(2019.01)权利要求书2页说明书15页附图4页(54)发明名称数据处理方法、装置、服务器及计算机可读存储介质(57)摘要本公开关于一种数据处理方法、装置、服务器及计算机可读存储介质,其中,上述数据处理方法包括:获取目标对象的搜索信息,其中,搜索信息包括至少一个搜索文本以及至少一个搜索文本对应的时间标识;基于时间标识对搜索信息进行聚类,得到第一序列,其中,第一序列由多个元素组成,每个元素包括至少一个搜索文本;获取多个元素中相邻元素之间的关联度,其中,多个元素按照预设的时间顺序排序;对关联度满足预设条件的相邻元素进行连接,得到目标元素;基于目标元素对第一序列进行更新,得到搜索序列,其中,搜索序列用于指示目标对象的搜索行为。本公开至少解决了相关技术中获取的搜索信息准确度低的问题。CN114238782ACN114238782A权利要求书1/2页1.一种数据处理方法,其特征在于,包括:获取目标对象的搜索信息,其中,所述搜索信息包括至少一个搜索文本以及所述至少一个搜索文本对应的时间标识;基于所述时间标识对所述搜索信息进行聚类,得到第一序列,其中,所述第一序列由多个元素组成,每个元素包括至少一个搜索文本;获取所述多个元素中相邻元素之间的关联度,其中,所述多个元素按照预设的时间顺序排序;对所述关联度满足预设条件的相邻元素进行连接,得到目标元素;基于所述目标元素对所述第一序列进行更新,得到搜索序列,其中,所述搜索序列用于指示所述目标对象的搜索行为。2.根据权利要求1所述的数据处理方法,其特征在于,所述获取所述多个元素中相邻元素之间的关联度,包括:按照所述时间顺序从第一元素所包含的至少一个搜索文本中获取第一搜索文本,其中,所述第一搜索文本为所述第一元素中的最后一个文本;按照所述时间顺序从第二元素所包含的至少一个搜索文本中获取第二搜索文本,其中,所述第一元素和所述第二元素为所述第一序列中在时间上相邻的两个元素,所述第二搜索文本为所述第二元素中的第一个文本,所述第一搜索文本对应的时间标识小于所述第二搜索文本对应的时间标识;计算所述第一搜索文本与所述第二搜索文本之间的相似度;根据所述相似度确定所述第一元素与所述第二元素之间的关联度。3.根据权利要求2所述的数据处理方法,其特征在于,所述计算所述第一搜索文本与所述第二搜索文本之间的相似度,包括:获取所述第一搜索文本在预设窗口下滑动所截取到的多个第一字节片段以及所述第二搜索文本在所述预设窗口下滑动所截取到的多个第二字节片段;计算所述多个第一字节片段所对应的第一概率以及所述多个第二字节片段所对应的第二概率,其中,所述第一概率表征所述多个第一字节片段在所述第一搜索文本中出现的频率,所述第二概率表征所述多个第二字节片段在所述第二搜索文本中出现的频率;根据所述第一概率以及所述第二概率确定所述第一搜索文本与所述第二搜索文本之间的相似度。4.根据权利要求3所述的数据处理方法,其特征在于,所述根据所述第一概率以及所述第二概率确定所述第一搜索文本与所述第二搜索文本之间的相似度,包括:计算所述多个第一字节片段的第一概率的乘积,得到所述第一搜索文本对应的第三概率;计算所述多个第二字节片段的第二概率的乘积,得到所述第二搜索文本对应的第四概率;根据所述第三概率和所述第四概率,得到所述第一搜索文本与所述第二搜索文本之间的相似度。5.根据权利要求2所述的数据处理方法,其特征在于,所述对所述关联度满足预设条件的相邻元素进行连接,得到目标元素,包括:2CN114238782A权利要求书2/2页在所述相似度大于或等于预设相似度时,获取所述第一元素与所述第二元素之间的关联度;在所述第一元素与所述第二元素之间的关联度大于预设关联度时,获取所述第一元素中的第三字节片段以及所述第二元素中的第四字节片段,其中,所述第三字节片段与所述第四字节片段为在时间上相邻的字节片段;根据所述第三字节片段与所述第四字节片段对所述第一元素和所述第二元素进行连接,得到所述目标元素。6.根据权利要求5所述的数据处理方法,其特征在于,所述基于所述目标元素对所述第一序列进行更新,得到搜索序列,包括:从所述第一序列所包含的多个元素中确定与所述目标元素对应的元素组合,其中,所述元素组合