预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共16页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN114297924A(43)申请公布日2022.04.08(21)申请号202111614410.1(22)申请日2021.12.27(71)申请人杭州迪普科技股份有限公司地址310051浙江省杭州市滨江区通和路68号中财大厦6楼(72)发明人史卓颖邹初建王涛(74)专利代理机构北京博思佳知识产权代理有限公司11415代理人王茹(51)Int.Cl.G06F30/27(2020.01)G06F30/18(2020.01)G06N20/00(2019.01)H04L9/40(2022.01)H04L61/4511(2022.01)权利要求书2页说明书9页附图4页(54)发明名称模型生成方法、装置、设备及计算机可读存储介质(57)摘要本申请提供了一种模型生成方法,包括:将至少一种向量生成方法、与至少两种域名检测算法进行组合,得到至少两种组合方式;对于每种组合方式,采用该组合方式下的向量生成方法,对域名样本库中的各个样本域名进行域名向量化,且基于生成的域名向量,采用该组合方式下的域名检测算法进行模型训练,得到该组合方式对应的待选域名检测模型;根据每种组合方式对应的待选域名检测模型的模型选择指标,选择一个待选域名检测模型,作为目标域名检测模型,以便利用目标域名检测模型进行域名检测。本申请能够在节省人力的情况下生成目标域名检测模型,且保证了域名检测时的准确性。本申请还提供了一种模型生成装置、设备及计算机可读存储介质。CN114297924ACN114297924A权利要求书1/2页1.一种模型生成方法,其特征在于,包括:将至少一种向量生成方法、与至少两种域名检测算法进行组合,得到至少两种组合方式;对于每种组合方式,采用该组合方式下的向量生成方法,对域名样本库中的各个样本域名进行域名向量化,且基于生成的域名向量,采用该组合方式下的域名检测算法进行模型训练,得到该组合方式对应的待选域名检测模型;确定每种组合方式对应的待选域名检测模型的模型选择指标;根据各个待选域名检测模型的模型选择指标,选择一个待选域名检测模型,作为目标域名检测模型,其中,所述目标域名检测模型用于对目标域名进行域名检测。2.根据权利要求1所述的方法,其特征在于,所述至少一种向量生成方法,包括以下至少一种方法:字典法、独热one‑hot编码方法、词向量word2vec编码方法、n元模型n‑gram与词袋法的组合编码方法、全局向量GloVe编码方法。3.根据权利要求1所述的方法,其特征在于,所述至少两种域名检测算法,包括以下至少两种算法:基于卷积神经网络的文本分类算法TextCNN、基于循环神经网络的文本分类算法TextRNN、长短期记忆LSTM算法、区域卷积神经网络RCNN算法、门控循环单元GRU算法。4.根据权利要求1‑3任一项所述的方法,其特征在于,所述模型选择指标,包括模型的训练耗时、预测耗时、预测能力和泛化能力中的至少一个。5.根据权利要求4所述的方法,其特征在于,所述确定每种组合方式对应的待选域名检测模型的模型选择指标,包括:对于每种组合方式对应的待选域名检测模型,基于该待选域名检测模型的模型训练阶段和模型验证阶段,确定该待选域名检测模型的训练耗时和预测能力,并且,基于该待选域名检测模型的模型测试阶段,确定该待选域名检测模型的预测耗时和泛化能力。6.根据权利要求1‑3任一项所述的方法,其特征在于,所述根据各个待选域名检测模型的模型选择指标,选择一个待选域名检测模型,包括:对于各个待选域名检测模型的各个模型选择指标,确定表征各个模型选择指标的指标情况的参数值,并确定表征各个模型选择指标的重要程度的权重值;依据各个待选域名检测模型对应的参数值和权重值,选择一个待选域名检测模型。7.一种模型生成装置,其特征在于,包括:模式组合单元,用于将至少一种向量生成方法、与至少两种域名检测算法进行组合,得到至少两种组合方式;模型训练单元,用于对于每种组合方式,采用该组合方式下的向量生成方法,对域名样本库中的各个样本域名进行域名向量化,且基于生成的域名向量,采用该组合方式下的域名检测算法进行模型训练,得到该组合方式对应的待选域名检测模型;指标确定单元,用于确定每种组合方式对应的待选域名检测模型的模型选择指标;模型选择单元,用于根据各个待选域名检测模型的模型选择指标,选择一个待选域名检测模型,作为目标域名检测模型,其中,所述目标域名检测模型用于对目标域名进行域名检测。2CN114297924A权利要求书2/2页8.根据权利要求7所述的装置,其特征在于,所述模型选择指标,包括模型的训练耗时、预测耗时、预测能力和泛化能力中的至少一个。9.一种电子设备,其特征在于,包括:处理器、存储器;所述存储器,用于存储计算机程序