预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共21页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113641696A(43)申请公布日2021.11.12(21)申请号202110925483.6(22)申请日2021.08.12(71)申请人北京百度网讯科技有限公司地址100085北京市海淀区上地十街10号百度大厦2层(72)发明人谭云飞钟贤德(74)专利代理机构北京柏杉松知识产权代理事务所(普通合伙)11413代理人孟维娜马敬(51)Int.Cl.G06F16/242(2019.01)G06F16/2458(2019.01)H04L29/06(2006.01)权利要求书3页说明书12页附图5页(54)发明名称一种虚假流量检测方法、装置、电子设备及存储介质(57)摘要本公开提供了一种虚假流量检测方法、装置、电子设备及存储介质,涉及互联网技术领域,尤其涉及流量检测技术领域。具体方案为:获得用户在目标平台上进行搜索时的搜索词条;对所述搜索词条进行向量化处理,得到表征所述搜索词条上下文信息的第一向量;根据所述搜索词条中不同类型的字符的占比,获得所述搜索词条的字符评估信息;对所述第一向量和字符评估信息进行融合,得到第二向量;根据所述第二向量检测所述目标用户搜索所述搜索词条时带来的访问流量是否为虚假流量。应用本公开的方案可以实现虚假流量检测。CN113641696ACN113641696A权利要求书1/3页1.一种虚假流量检测方法,所述方法包括:获得用户在目标平台上进行搜索时的搜索词条;对所述搜索词条进行向量化处理,得到表征所述搜索词条上下文信息的第一向量;根据所述搜索词条中不同类型的字符的占比,获得所述搜索词条的字符评估信息;对所述第一向量和字符评估信息进行融合,得到第二向量;根据所述第二向量检测所述目标用户搜索所述搜索词条时带来的访问流量是否为虚假流量。2.根据权利要求1所述的方法,其中,所述根据所述第二向量检测所述目标用户搜索所述搜索词条时带来的访问流量是否为虚假流量,包括:获得包含所述搜索词条中不同类型的字符的占比的第三向量;将所述第二向量、第三向量融合得到融合向量,根据所述融合向量检测所述目标用户搜索所述搜索词条时带来的访问流量是否为虚假流量。3.根据权利要求2所述的方法,其中,所述获得包含所述搜索词条中不同类型的字符的占比的第三向量,包括:确定以数字形式表示的所述搜索词条所属分类的目标分类标识;获得包含所述搜索词条中不同类型的字符的占比、所述目标分类标识的第三向量。4.根据权利要求1所述的方法,其中,所述对所述搜索词条进行向量化处理,得到表征所述搜索词条上下文信息的第一向量,包括:将所述搜索词条输入预先训练完成的流量检测模型中的向量化层,得到所述向量化层输出的表征所述搜索词条上下文信息的第一向量;所述对所述第一向量和字符评估信息进行融合,得到第二向量,包括:将所述第一向量、字符评估信息输入所述流量检测模型中的向量融合层,利用所述向量融合层对所述第一向量和字符评估信息进行融合,得到第二向量;所述根据所述第二向量检测所述目标用户搜索所述搜索词条时带来的访问流量是否为虚假流量,包括:将所述第二向量输入所述流量检测模型中的流量检测层,利用所述流量检测层检测所输入的向量对应的访问流量是否为虚假流量,得到所述流量检测层输出的检测结果。5.根据权利要求4所述的方法,其中,所述将所述第二向量输入所述流量检测模型中的流量检测层,利用所述流量检测层检测所输入的向量对应的访问流量是否为虚假流量,得到所述流量检测层输出的检测结果,包括:将所述第二向量、第三向量输入所述流量检测层,其中,所述第三向量中包含所述搜索词条中不同类型的字符的占比;利用所述流量检测层将所述第二向量、第三向量融合得到融合向量,根据所述融合向量检测所述目标用户搜索所述搜索词条时带来的访问流量是否为虚假流量。6.根据权利要求3所述的方法,其中,所述流量检测模型通过以下方式训练得到:获得样本用户在样本平台上进行搜索时的样本搜索词条;获得所述样本搜索词条的标注信息,其中,每一样本搜索词条的标注信息用于反映:该样本搜索词条对应的流量是否为虚假流量;根据所述样本搜索词条中不同类型的字符的占比,获得所述样本搜索词条的样本字符2CN113641696A权利要求书2/3页评估信息;利用所述样本搜索词条、样本字符评估信息和标注信息训练所述流量检测模型。7.根据权利要求6所述的方法,其中,所述样本用户为:满足预设的行为稀疏条件的用户,所述行为稀疏条件包括:预设周期内每一预设时间段访问所述样本平台的次数少于预设的次数阈值。8.根据权利要求6所述的方法,其中,所述样本搜索词条包括:第一数量比例的第一类词条、第二数量比例的第二类词条;所述第一类词条为:所述样本用户在预设的访问高峰时间段内在所述样本平台上进行搜索时的搜索词