预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共19页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN115017145A(43)申请公布日2022.09.06(21)申请号202210625648.2(22)申请日2022.06.02(71)申请人中邮信息科技(北京)有限公司地址100037北京市海淀区增光路55号3号楼1201-1室(72)发明人胡晓菁徐廷冯媛周立芳朱煜民姚奇灏何利平杨雯婷刘杨李芸(74)专利代理机构北京品源专利代理有限公司11332专利代理师初春(51)Int.Cl.G06F16/215(2019.01)G06F16/23(2019.01)G06K9/62(2022.01)权利要求书2页说明书12页附图4页(54)发明名称数据扩展方法、装置及存储介质(57)摘要本发明实施例公开了一种数据扩展方法、装置及存储介质。该方法包括:获取目标业务场景中的参考数据集,以及与所述目标业务场景关联的关联业务场景的待扩展数据集;确定所述参考数据集中各数据的参考特征数据,并确定所述参考特征数据中的目标特征数据;于所述待扩展数据集中选取具有所述目标特征数据的第一待扩展数据,并将所述第一待扩展数据作为所述目标业务场景的目标扩展数据。本发明实施例中的技术方案,实现了更加快速有效的对数据进行扩展,从而减少数据扩展的耗时,进一步提升数据扩展的效率。CN115017145ACN115017145A权利要求书1/2页1.一种数据扩展方法,其特征在于,包括:获取目标业务场景中的参考数据集,以及与所述目标业务场景关联的关联业务场景的待扩展数据集;确定所述参考数据集中各数据的参考特征数据,并确定所述参考特征数据中的目标特征数据;于所述待扩展数据集中选取具有所述目标特征数据的第一待扩展数据,并将所述第一待扩展数据作为所述目标业务场景的目标扩展数据。2.根据权利要求1所述的方法,其特征在于,确定所述参考特征数据中的目标特征数据,包括:根据所述参考特征数据的重要程度系数,确定所述参考特征数据中与所述目标业务场景关联的正向特征数据;基于当前时刻和所述正向特征数据的目标更新时刻之间的间隔时长,确定所述正向特征数据中的目标特征数据。3.根据权利要求2所述的方法,其特征在于,所述基于当前时刻和所述目标更新时刻之间的间隔时长,确定所述正向特征数据中的目标特征数据,包括:根据所述当前时刻和所述目标更新时刻之间的间隔时长,计算得到所述正向特征数据的更新度量值,其中,所述更新度量值用于衡量所述正向特征数据的更新间隔时长;从所述更新度量值中选取符合预设度量条件的更新度量值,作为目标度量值,并将所述目标度量值所对应的正向特征数据作为目标特征数据。4.根据权利要求3所述的方法,其特征在于,所述根据所述当前时刻和所述目标更新时刻之间的间隔时长,计算得到所述正向特征数据的更新度量值,包括:按照下述公式计算得到所述正向特征数据的更新度量值:其中,Xi'表示所述正向特征数据的更新度量值,Xi表示当前时刻和所述正向特征数据的更新时刻之间的间隔时长。5.根据权利要求1所述的方法,其特征在于,所述方法还包括:确定所述待扩展数据集中各数据的待扩展特征数据;根据各待扩展特征数据,于所述待扩展数据集中选取所述目标业务场景的第二扩展数据;所述将所述第一扩展数据作为所述目标业务场景的目标扩展数据,包括:将所述第一扩展数据和所述第二扩展数据中的全部用户作为所述目标业务场景的目标扩展数据;或,将所述第一扩展数据和所述第二扩展数据中的公有用户作为所述目标业务场景的目标扩展数据。6.根据权利要求5所述的方法,其特征在于,所述根据各待扩展特征数据,于所述待扩展数据集中选取所述目标业务场景的第二扩展数据,包括:将所述目标特征数据进行聚类处理,得到聚类中心;计算各待扩展特征数据与所述聚类中心之间的数据距离;2CN115017145A权利要求书2/2页基于各数据距离,于所述待扩展数据集中选取所述目标业务场景的第二扩展数据。7.根据权利要求5所述的方法,其特征在于,所述根据各待扩展特征数据,于所述待扩展数据集中选取所述目标业务场景的第二扩展数据,包括:将所述待扩展特征数据分别输入到针对不同扩展维度进行数据扩展的数据扩展模型中,得到各数据扩展模型输出的数据扩展值;对各数据扩展值进行加权平均处理,得到目标扩展值,根据所述目标扩展值,于所述待扩展数据集中选取所述目标业务场景中的第二扩展数据。8.根据权利要求7所述的方法,其特征在于,所述方法还包括:针对每个扩展维度的初始网络模型,获取样本数据和与所述样本数据对应的期望输出数据,其中,所述样本数据包括正样本数据和负样本数据,所述正样本数据包括所述参考特征数据,所述负样本数据为除所述目标业务场景之外的其他业务场景的特征数据;将所述样本数据输入到所述初始网络模型中,得到所述初始网络模型的实际输出数据;根据所述样本