预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共13页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN106202570A(43)申请公布日2016.12.07(21)申请号201610659017.7(22)申请日2016.08.11(71)申请人乐视控股(北京)有限公司地址100025北京市朝阳区姚家园路105号3号楼10层1102申请人乐视网信息技术(北京)股份有限公司(72)发明人赵九龙(74)专利代理机构北京鼎佳达知识产权代理事务所(普通合伙)11348代理人王伟锋刘铁生(51)Int.Cl.G06F17/30(2006.01)G06K9/00(2006.01)G06Q30/02(2012.01)权利要求书2页说明书8页附图2页(54)发明名称一种用户信息获取方法及装置(57)摘要本发明实施例提供一种用户信息获取方法及装置,涉及计算机技术领域,主要目的在于通过定期更新预测模型的训练样本,来提高预测模型计算用户特征信息的稳定性。本发明实施例所采用的技术方案是:采集多媒体样本集合,其中,所述多媒体样本集合包括具有区分用户特征信息的多媒体样本;统计所述多媒体样本集合的观看用户,筛选出训练用户样本,所述训练用户样本为具有明确用户特征信息的用户样本;利用所述训练用户样本训练用户信息获取模型,使用所述用户信息获取模型获取目标用户的特征信息。本发明主要用于获取用户的特征信息。CN106202570ACN106202570A权利要求书1/2页1.一种用户信息获取方法,其特征在于,所述方法包括:采集多媒体样本集合,其中,所述多媒体样本集合包括具有区分用户特征信息的多媒体样本;统计所述多媒体样本集合的观看用户,筛选出训练用户样本,所述训练用户样本为具有明确用户特征信息的用户样本;利用所述训练用户样本训练用户信息获取模型,使用所述用户信息获取模型获取目标用户的特征信息。2.根据权利要求1所述的方法,其特征在于,所述采集多媒体样本集合包括:根据预置规则采集多媒体样本,其中,所述多媒体样本标注有用户特征信息倾向标签;根据所述用户特征信息倾向标签筛选出多个多媒体样本,生成多媒体样本集合。3.根据权利要求1所述的方法,其特征在于,所述采集多媒体样本集合包括:根据预置的时间间隔定期采集多媒体样本集合。4.根据权利要求1所述的方法,其特征在于,所述统计所述多媒体样本集合的观看用户,筛选出训练用户样本包括:获取所述多媒体样本集合中每一个多媒体样本的观看用户,得到观看用户集合;根据所述观看用户集合中每一个用户的多媒体观看记录,统计每一个用户观看所述多媒体样本集合中的多媒体数量;根据所述多媒体数量确定所述训练用户样本。5.根据权利要求4所述的方法,其特征在于,所述根据所述多媒体数量确定所述训练用户样本包括:获取用户观看的所述多媒体样本的用户特征信息倾向标签;根据不同用户特征信息倾向标签的权重,计算每一个用户的用户特征信息倾向得分,所述权重用于表示用户特征信息倾向标签的倾向程度;根据所述用户特征信息倾向得分的排序确定所述训练用户样本。6.一种用户信息获取装置,其特征在于,所述装置包括:采集单元,用于采集多媒体样本集合,其中,所述多媒体样本集合包括具有区分用户特征信息的多媒体样本;选择单元,用于统计所述采集单元得到的多媒体样本集合的观看用户,筛选出训练用户样本,所述训练用户样本为具有明确用户特征信息的用户样本;获取单元,用于利用所述选择单元选择的训练用户样本训练用户信息获取模型,使用所述用户信息获取模型获取目标用户的特征信息。7.根据权利要求6所述的装置,其特征在于,所述采集单元包括:采集模块,用于根据预置规则采集多媒体样本,其中,所述多媒体样本标注有用户特征信息倾向标签;生成模块,用于根据所述用户特征信息倾向标签在所述采集模块采集的多媒体样本集合中筛选出多个多媒体样本,生成多媒体样本集合。8.根据权利要求6所述的装置,其特征在于,所述采集单元包括:定时模块,用于根据预置的时间间隔定期采集多媒体样本集合。9.根据权利要求6所述的装置,其特征在于,所述选择单元包括:2CN106202570A权利要求书2/2页获取模块,用于获取所述多媒体样本集合中每一个多媒体样本的观看用户,得到观看用户集合;统计模块,用于根据所述获取模块获取的观看用户集合中每一个用户的多媒体观看记录,统计每一个用户观看所述多媒体样本集合中的多媒体数量;确定模块,用于根据所述统计模块统计的多媒体数量确定所述训练用户样本。10.根据权利要求9所述的装置,其特征在于,所述确定模块包括:获取子模块,用于获取用户观看的所述多媒体样本的用户特征信息倾向标签;计算子模块,用于根据不同用户特征信息倾向标签的权重,计算每一个用户的用户特征信息倾向得分,所述权重用于表示用户特征信息倾向标签的倾向程度;确定子模块,用于根据所述计算子模块计算