预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共20页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN115033916A(43)申请公布日2022.09.09(21)申请号202210634258.1(22)申请日2022.06.07(71)申请人支付宝(杭州)信息技术有限公司地址310000浙江省杭州市西湖区西溪路556号8层B段801-11(72)发明人彭志成陈维钟明洁(74)专利代理机构北京亿腾知识产权代理事务所(普通合伙)11309专利代理师陈霁周良玉(51)Int.Cl.G06F21/62(2013.01)G06F21/60(2013.01)G06Q30/02(2012.01)权利要求书3页说明书13页附图3页(54)发明名称基于多方联合数据训练推送模型及信息推送的方法和装置(57)摘要本说明书实施例提供一种基于多方联合数据训练推送模型及信息推送的方法和装置,在信息推送业务场景下,联合多个数据方的用户数据进行信息推送。在联合使用多个数据方的用户数据的过程中,为了保护数据隐私,可以通过差分隐私、同态加密、用统计值、排序值等中的至少一项对本地数据加密,然后对加密数据进行整合,得到密文分布数据作为推送模型的输入数据。由于推送模型只感知密文状态下的数据分布,而不使用真实数值,从而可以保护各个数据方的数据隐私,为跨域的信息推送提供有效的实现方式。CN115033916ACN115033916A权利要求书1/3页1.一种基于多方联合数据训练推送模型的方法,用于多个数据方利用各自的隐私数据共同训练推送模型;所述方法包括:获取第一训练样本,其中,所述第一训练样本对应有基于第一搜索记录的第一密文分布数据及第一响应标签,所述第一密文分布数据基于对各个数据方提供的行为特征的加密数据的整合得到,单个数据方提供的行为特征基于所述第一用户的本地历史行为数据提取,单个行为特征对应有各个目标类别下的各个特征值,所述第一响应标签基于所述第一搜索记录中所述第一用户针对所推送的第一信息的第一响应信息提取;将所述第一密文分布数据输入预先确定的推送模型,得到第一预测结果;基于所述第一预测结果与所述第一响应标签的对比,调整所述推送模型的待定参数。2.根据权利要求1所述的方法,其中,所述多个历史行为特征包括浏览时长、浏览频次、浏览行为距离当前时长、搜索频次、点击频次、搜索行为距离当前时长中的至少一项。3.根据权利要求1所述的方法,其中,单个目标类别对应单个页面或多个页面,单个行为特征在多个目标类别下的各个特征值为所述第一用户针对相应页面进行相应操作行为的操作值、相应操作值的归一化值、相应操作值的相对重要度值中的一项。4.根据权利要求1所述的方法,其中,单个数据方针对单个行为特征,通过以下方式确定相应的加密数据:基于该单个行为特征对应于各个目标类别的各个特征值,确定该单个行为特征各个特征值的单个均值和单个方差;生成满足所述单个均值和单个方差的高斯噪声;将所述高斯噪声添加到该单个行为特征各个特征值中,形成加密数据。5.根据权利要求1所述的方法,其中,单个数据方针对单个行为特征,通过以下方式确定相应的加密数据:将该单个行为特征的各个特征值按照大小顺序确定相应的各个排列序次;基于各个排列序次确定该单个行为特征各个特征值的加密结果,得到相应的加密数据。6.根据权利要求5所述的方法,其中,所述基于各个排列序次确定各个特征值的加密结果包括:使用满足全同态加密的第一映射函数将各个排列序次映射到预定值域,得到各个映射结果,所述第一映射函数由各个数据方预先协商一致;将各个映射结果分别作为各个特征值的各个加密结果。7.根据权利要求1所述的方法,其中,单个数据方针对单个行为特征,通过以下方式确定相应的加密数据:针对所述单个行为特征,在多个预定时间段上重复采样,得到多条特征数据,单条特征数据包括与单个预定时间段内的各个目标类别一一对应的各个特征值;统计各个目标类别分别对应的各个表征参数对,单个表征参数对包括单个目标类别的单个行为特征在多个预定时间段上相应的多个特征值的均值和方差;利用各个表征参数对确定所述单个行为特征对应于各个目标类别的加密数据。8.根据权利要求1所述的方法,其中,对各个数据方提供的行为特征的加密数据的整合通过加和、求平均、取中位数中的至少一种方式进行。2CN115033916A权利要求书2/3页9.根据权利要求1所述的方法,其中,所述推送模型为分类模型,所述第一预测结果为用户分别针对各个目标类别的各个选中概率,所述第一响应标签中与所述第一信息的目标类别对应的元素为第一值或第二值,在第一响应信息为点击所述第一信息的情况下,所述第一响应标签对应第一值,在第一响应信息为未点击所述第一信息的情况下,所述第一响应标签对应第二值。10.根据权利要求1所述的方法,其中,所述推送模型的输出结果为用户选中概率最大的若干个目