预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共21页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN114168810A(43)申请公布日2022.03.11(21)申请号202111402741.9(22)申请日2021.11.19(71)申请人北京达佳互联信息技术有限公司地址100085北京市海淀区上地西路6号1幢1层101D1-7(72)发明人朱晓旭王建强(74)专利代理机构北京中博世达专利商标代理有限公司11274代理人申健(51)Int.Cl.G06F16/903(2019.01)G06F16/9032(2019.01)权利要求书2页说明书14页附图4页(54)发明名称搜索意图确定方法、装置、设备以及存储介质(57)摘要本公开提供一种搜索意图确定方法、装置、设备以及存储介质,涉及人工智能技术领域,以至少解决现有技术中确定的搜索意向准确率低的问题。该方法包括:获取搜索会话序列,搜索会话序列包括至少两个连续的搜索会话;针对搜索会话序列中的每个搜索会话,获取搜索会话对应的维度特征,维度特征包括目标特征;目标特征为基于搜索会话对应的账户的历史搜索会话的停顿时间,对搜索会话的搜索意图进行预估得到的;根据搜索会话对应的维度特征,确定搜索会话的意图标签;意图标签用于表征搜索会话的搜索意图与相邻搜索会话的搜索意图之间的连续性。CN114168810ACN114168810A权利要求书1/2页1.一种搜索意图确定方法,其特征在于,包括:获取搜索会话序列,所述搜索会话序列包括至少两个连续的搜索会话;针对所述搜索会话序列中的每个搜索会话,获取所述搜索会话对应的维度特征,所述维度特征包括目标特征;所述目标特征为基于所述搜索会话对应的账户的历史搜索会话的停顿时间,对所述搜索会话的搜索意图进行预估得到的;根据所述搜索会话对应的维度特征,确定所述搜索会话的意图标签;所述意图标签用于表征所述搜索会话的搜索意图与相邻搜索会话的搜索意图之间的连续性。2.根据权利要求1所述的方法,其特征在于,所述搜索会话对应的维度特征还包括下述至少一个:公共词长度特征、分词后的重合度特征和相似度特征;所述公共词长度特征包括:第一长度参数或第二长度参数,所述第一长度参数用于表征公共词的长度值相对于所述相邻搜索会话的词的长度值的占比,所述第二长度参数用于表征公共词的长度值相对于所述搜索会话的词的长度值的占比;所述公共词为所述搜索会话和所述相邻搜索会话中共有的词;所述分词后的重合度特征包括:第一重合度参数或第二重合度参数,所述第一重合度参数用于表征公共语素相对于所述相邻搜索会话对应的分词的重合程度,所述第二重合度参数用于表征所述公共语素相对于所述搜索会话的分词的重合程度;所述公共语素为对所述搜索会话和所述相邻搜索会话中具备相同属性的词;所述相似度特征包括:所述搜索会话和所述相邻搜索会话的文本余弦距离。3.根据权利要求2所述的方法,其特征在于,在所述相邻搜索会话包括所述搜索会话的前一个搜索会话的情况下,所述维度特征包括第一时间间隔,所述第一时间间隔为所述搜索会话与所述前一个搜索会话的时间间隔;在所述相邻搜索会话包括所述搜索会话的后一个搜索会话的情况下,所述维度特征包括第二时间间隔,所述第二时间间隔为所述搜索会话与所述后一个搜索会话的时间间隔。4.根据权利要求1至3中任一项所述的方法,其特征在于,所述根据所述每个搜索会话对应的维度特征,确定所述每个搜索会话的意图标签,包括:将所述每个搜索会话对应的维度特征输入搜索意图确定模型,得到所述每个搜索会话的意图标签,所述搜索意图确定模型为梯度提升决策树模型。5.根据权利要求1所述的方法,其特征在于,所述方法还包括:获取搜索会话序列样本和所述搜索会话序列样本中每个搜索会话样本的标准意图标签;其中,所述标准意图标签为第一标签或者第二标签,所述第一标签用于表征所述搜索会话样本为所述搜索会话序列样本中的第一个搜索会话样本,且所述第一个搜索会话样本为搜索意图对应的起始搜索会话样本,或者所述搜索会话样本的搜索意图与前一个搜索会话样本的搜索意图不一致;所述第二标签用于表征搜索会话样本的搜索意图与前一个搜索会话样本的搜索意图类似;所述搜索意图类似包括搜索意图相同、搜索意图的范围缩小、搜索意图的范围扩大或搜索意图相关;根据所述搜索会话序列样本和所述标准意图标签训练预设模型,得到所述搜索意图确定模型。6.根据权利要求1至3中任一项所述的方法,其特征在于,所述方法还包括:基于所述搜索会话序列和所述每个搜索会话对应的意图标签,对属于同一意图标签的2CN114168810A权利要求书2/2页搜索会话进行归类,得到搜索会话库;或,基于所述搜索会话序列和所述每个搜索会话对应的意图标签,对属于同一意图标签的搜索会话对应的搜索结果进行整合,得到搜索结果库。7.一种搜索意图确定装置,其特征在于,