预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共14页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN112148919A(43)申请公布日2020.12.29(21)申请号202011059516.5(22)申请日2020.09.30(71)申请人哈尔滨理工大学地址150080黑龙江省哈尔滨市南岗区学府路52号(72)发明人彭立涵王建民(74)专利代理机构黑龙江立超同创知识产权代理有限责任公司23217代理人杨立超(51)Int.Cl.G06F16/65(2019.01)G06N20/20(2019.01)G06N5/00(2006.01)G06F16/635(2019.01)权利要求书2页说明书8页附图3页(54)发明名称一种基于梯度提升树算法的音乐点击率预测方法及装置(57)摘要一种基于梯度提升树算法的音乐点击率预测方法及装置,属于机器学习技术领域,用以解决现有技术中音乐平台不能根据用户的个体特征和偏好变化进行高质量的音乐作品推荐的问题。本发明方法的技术要点包括,获取音乐数据训练集和测试集并分别提取音乐特征和用户特征;对提取的音乐特征和用户特征进行处理;对处理后的特征数据进行数据格式统一,获取训练特征数据集和待预测测试特征数据集;利用梯度提升树算法对训练特征数据集进行训练,获取预测模型;根据预测模型对待预测测试特征数据集进行预测分类。本发明可用于音乐平台针对不同的用户推荐不同的音乐作品。CN112148919ACN112148919A权利要求书1/2页1.一种基于梯度提升树算法的音乐点击率预测方法,其特征在于,包括以下步骤,步骤一、获取音乐数据训练集和测试集并分别提取音乐特征和用户特征;步骤二、对提取的音乐特征和用户特征进行处理;步骤三、对处理后的特征数据进行数据格式统一,获取训练特征数据集和待预测测试特征数据集;步骤四、利用梯度提升树算法对训练特征数据集进行训练,获取预测模型;步骤五、根据预测模型对待预测测试特征数据集进行预测分类。2.根据权利要求1所述一种基于梯度提升树算法的音乐点击率预测方法,其特征在于,步骤一中所述音乐特征包括音乐名称、音乐时长、歌曲风格、主唱、作曲家、填词者、语言以及唯一标识;所述用户特征包括用户年龄、城市、性别、app注册方式、app注册时间以及app最近登录时间。3.根据权利要求1所述一种基于梯度提升树算法的音乐点击率预测方法,其特征在于,步骤二中对提取的音乐特征和用户特征进行处理包括,对特征缺失值进行填充或删除处理;对特征异常值进行处理;对已有特征进行拆分。4.根据权利要求1所述一种基于梯度提升树算法的音乐点击率预测方法,其特征在于,步骤三中对处理后的特征数据进行数据格式统一包括对分类型特征数据进行编码;对数值型特征数据进行标准化。5.根据权利要求1所述一种基于梯度提升树算法的音乐点击率预测方法,其特征在于,步骤四中利用梯度提升树算法对训练特征数据集进行训练之前首先设置模型参数,采用网格搜索算法进行调参,获取最优参数。6.根据权利要求1所述一种基于梯度提升树算法的音乐点击率预测方法,其特征在于,步骤四中所述预测模型即最终得到的强分类器迭代公式为:Fm(x)=Fm-1(x)+γmhm(x)其中,γm表示权重缩减系数,其取值为(0,1];hm(x)表示弱分类器。7.一种基于梯度提升树算法的音乐点击率预测装置,其特征在于,包括,特征提取模块,用于获取音乐数据训练集和测试集并分别提取音乐特征和用户特征;特征处理模块,用于对提取的音乐特征和用户特征进行处理;数据格式处理模块,用于对处理后的特征数据进行数据格式统一,包括对分类型特征数据进行编码和对数值型特征数据进行标准化,获取训练特征数据集和待预测测试特征数据集;模型训练模块,用于利用梯度提升树算法对训练特征数据集进行训练,获取预测模型;预测分类模块,用于根据预测模型对待预测测试特征数据集进行预测分类。8.根据权利要求7所述一种基于梯度提升树算法的音乐点击率预测装置,其特征在于,特征提取模块中提取的所述音乐特征包括音乐名称、音乐时长、歌曲风格、主唱、作曲家、填词者、语言以及唯一标识;提取的所述用户特征包括用户年龄、城市、性别、app注册方式、app注册时间以及app最近登录时间。9.根据权利要求7所述一种基于梯度提升树算法的音乐点击率预测装置,其特征在于,特征处理模块中对提取的音乐特征和用户特征进行处理包括,对特征缺失值进行填充或删除处理;对特征异常值进行处理;对已有特征进行拆分。2CN112148919A权利要求书2/2页10.根据权利要求7所述一种基于梯度提升树算法的音乐点击率预测装置,其特征在于,模型训练模块中利用梯度提升树算法对训练特征数据集进行训练之前首先设置模型参数,采用网格搜索算法进行调参,获取最优参数,所述预测模型即最终得到的强分类器迭代公式为:Fm(x)=