预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共15页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113988165A(43)申请公布日2022.01.28(21)申请号202111232979.1(22)申请日2021.10.22(71)申请人北京京东振世信息技术有限公司地址100086北京市海淀区知春路76号6层(72)发明人杨雨田(74)专利代理机构北京品源专利代理有限公司11332代理人马迪(51)Int.Cl.G06K9/62(2022.01)G06N20/00(2019.01)权利要求书2页说明书10页附图2页(54)发明名称数据采集方法、装置、电子设备和存储介质(57)摘要本发明实施例公开了一种数据采集方法、装置、电子设备和存储介质,该数据采集方法包括:根据目标仓库的物品的历史需求量特征数据构建样本,得到原始样本集;根据原始样本集中的每个样本对应的数据产生时间将原始样本集中的样本分类;获取为分类得到的每类样本集设置的样本采集策略;按照样本采集策略从对应类别的样本集中采集样本,得到目标样本集。目标样本集用于模型训练,可以提高模型训练效率、提高训练出的模型的预测准确度。CN113988165ACN113988165A权利要求书1/2页1.一种数据采集方法,其特征在于,包括:根据目标仓库的物品的历史需求量特征数据构建样本,得到原始样本集;根据所述原始样本集中的每个样本对应的数据产生时间将所述原始样本集中的样本分类;获取为分类得到的每类样本集设置的样本采集策略;按照所述样本采集策略从对应类别的样本集中采集样本,得到目标样本集。2.根据权利要求1所述的数据采集方法,其特征在于,所述目标样本集用于训练基于特征的时序预测算法模型,所述时序预测算法模型用于预测所述目标仓库的物品的未来需求量。3.根据权利要求1所述的数据采集方法,其特征在于,所述根据所述原始样本集中的每个样本对应的数据产生时间将所述原始样本集中的样本分类,包括:将所述原始样本集中对应的数据产生时间属于预设时间集合的样本分类为第一样本集;将所述原始样本集中除所述第一样本集之外的样本分类为第二样本集。4.根据权利要求3所述的数据采集方法,其特征在于,所述获取为分类得到的每类样本集设置的样本采集策略,包括:获取为所述第一样本集设置的第一样本采集策略,所述第一样本采集策略为基于密度聚类算法的样本采集策略;获取为所述第二样本集设置的第二样本采集策略,所述第二样本采集策略为基于指数衰减算法的样本采集策略。5.根据权利要求4所述的数据采集方法,其特征在于,所述按照所述样本采集策略从对应类别的样本集中采集样本,得到目标样本集,包括:按照所述第一样本采集策略从所述第一样本集采集样本,得到第一样本子集;按照所述第二样本采集策略从所述第二样本集采集样本,得到第二样本子集;合并所述第一样本子集和所述第二样本子集,得到所述目标样本集。6.根据权利要求5所述的数据采集方法,其特征在于,所述按照所述第一样本采集策略从所述第一样本集采集样本,得到第一样本子集,包括:获取设置的聚类半径和聚类密度最小值;基于所述聚类半径和所述聚类密度最小值对所述第一样本集聚类,得到样本簇,将所述样本簇作为所述第一样本子集。7.根据权利要求5所述的数据采集方法,其特征在于,所述按照所述第二样本采集策略从所述第二样本集采集样本,得到第二样本子集,包括:将所述第二样本集中的每个样本对应的数据产生时间输入指数衰减模型,得到所述第二样本集中的每个样本的采样权重衰减系数;根据所述第二样本集中的每个样本的采样权重衰减系数确定所述第二样本集中的每个样本的采样权重;根据所述第二样本集中的每个样本的采样权重从所述第二样本集采集样本,得到所述第二样本子集。8.根据权利要求7所述的数据采集方法,其特征在于,所述指数衰减模型如下:2CN113988165A权利要求书2/2页‑γtN(t)=N0e其中,N(t)表示样本的采样权重衰减系数,N0为第一预设参数,γ为第二预设参数,t为样本对应的数据产生时间。9.一种数据采集装置,其特征在于,包括:样本构建模块,用于根据目标仓库的物品的历史需求量特征数据构建样本,得到原始样本集;样本分类模块,用于根据所述原始样本集中的每个样本对应的数据产生时间将所述原始样本集中的样本分类;策略获取模块,用于获取为分类得到的每类样本集设置的样本采集策略;样本采集模块,用于按照所述样本采集策略从对应类别的样本集中采集样本,得到目标样本集。10.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至8中任一所述的数据采集方法。11.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1至8中任一所述的数据采集方法。