预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共21页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN112015870A(43)申请公布日2020.12.01(21)申请号202010963165.4(22)申请日2020.09.14(71)申请人支付宝(杭州)信息技术有限公司地址310013浙江省杭州市西湖区西溪路556号8层B段801-11(72)发明人屈晋宇(74)专利代理机构北京智信禾专利代理有限公司11637代理人赵杰(51)Int.Cl.G06F16/33(2019.01)G06F16/31(2019.01)G06F40/30(2020.01)G06K9/62(2006.01)权利要求书2页说明书14页附图4页(54)发明名称数据上传方法及装置(57)摘要本说明书提供数据上传方法及装置,其中所述数据上传方法包括:获取至少两个待上传数据;针对至少两个待上传数据中的每一个待上传数据,拆分待上传数据获得多个数据字段,确定多个数据字段中每个数据字段对应的数据指标;对于目标数据指标,在目标数据指标对应的数据字段的数据是在相同采集条件下获取的情况下,判断目标数据指标对应的数据字段的数据是否相同,若相同,则确定目标数据指标对应的数据字段通过审核;针对任一待上传数据,若待上传数据的多个数据字段均通过审核,则确定待上传数据通过审核,将待上传数据上传至目标上传平台。实现了在将待上传数据上传至目标上传平台之前,预先获知合规风险,保证了数据的合规性。CN112015870ACN112015870A权利要求书1/2页1.一种数据上传方法,所述方法包括:获取至少两个待上传数据;针对所述至少两个待上传数据中的每一个待上传数据,拆分所述待上传数据获得多个数据字段,确定所述多个数据字段中每个数据字段对应的数据指标;对于目标数据指标,在所述目标数据指标对应的数据字段的数据是在相同采集条件下获取的情况下,判断所述目标数据指标对应的数据字段的数据是否相同,若相同,则确定所述目标数据指标对应的数据字段通过审核;针对任一所述待上传数据,若所述待上传数据的多个数据字段均通过审核,则确定所述待上传数据通过审核,将所述待上传数据上传至目标上传平台。2.根据权利要求1所述的数据上传方法,所述确定所述多个数据字段中每个数据字段对应的数据指标之后,还包括:按照所述数据指标,对应存储所述数据指标对应的数据字段的数据以及目标上传信息,所述目标上传信息是指所述数据指标对应的数据字段所属的待上传数据的上传信息,其中,所述上传信息包括上传平台、上传时间和/或上传方信息。3.根据权利要求1所述的数据上传方法,所述至少两个待上传数据为通过同一交互接口或不同交互接口接收的,且所述至少两个待上传数据上传至同一上传平台或不同上传平台。4.根据权利要求1所述的数据上传方法,所述判断所述目标数据指标对应的数据字段的数据是否相同之后,还包括:若不相同,则确定所述目标数据指标对应的数据字段未通过审核;将所述未通过审核的数据字段对应的待上传数据确定为待处理数据;在所述待处理数据处理完毕的情况下,将处理完毕的待处理数据上传至目标上传平台。5.根据权利要求1所述的数据上传方法,所述拆分所述待上传数据获得多个数据字段,包括:将所述待上传数据输入预设分段模型;基于所述预设分段模型,确定所述待上传数据对应的多个数据字段。6.根据权利要求1所述的数据上传方法,所述拆分所述待上传数据获得多个数据字段,包括:对所述待上传数据进行语义分析,确定多个起始分段点;基于所述多个起始分段点,将所述待上传数据拆分为多个数据字段,每个起始分段点和下一个起始分段点之间的数据构成一个数据字段。7.根据权利要求1所述的数据上传方法,所述确定所述多个数据字段中每个数据字段对应的数据指标,包括:针对所述多个数据字段中的每个数据字段,通过预设关键词提取模型提取所述数据字段的目标关键词;根据预先存储的关键词和指标之间的对应关系,确定所述目标关键词对应的数据指标。8.根据权利要求7所述的数据上传方法,所述预设关键词提取模型通过如下方法训练2CN112015870A权利要求书2/2页得到:获取数据样本,所述数据样本包括样本标签,其中,所述样本标签包括目标关键词;将所述数据样本输入初始模型,得到预测关键词;基于所述预测关键词和所述目标关键词确定损失值,基于所述损失值对所述初始模型进行训练,直至达到训练停止条件,得到所述预设关键词提取模型。9.根据权利要求8所述的数据上传方法,所述基于所述损失值对所述初始模型进行训练,直至达到训练停止条件,包括:判断所述损失值是否小于预设阈值;若否,则返回执行所述获取数据样本的步骤,并继续训练;若是,则确定达到所述训练停止条件。10.一种数据上传装置,所述装置包括:获取模块,被配置为获取至少两个待上传数据;第一确定模块,被配置为针对所述至