预览加载中,请您耐心等待几秒...
1/9
2/9
3/9
4/9
5/9
6/9
7/9
8/9
9/9

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN109271550A(43)申请公布日2019.01.25(21)申请号201810841931.2(22)申请日2018.07.27(71)申请人华南理工大学地址510640广东省广州市天河区五山路381号(72)发明人王一歌叶展鹏韦岗(74)专利代理机构广州粤高专利商标代理有限公司44102代理人何淑珍江裕强(51)Int.Cl.G06F16/635(2019.01)G06K9/62(2006.01)G06N3/04(2006.01)G06N3/08(2006.01)权利要求书2页说明书4页附图2页(54)发明名称一种基于深度学习的音乐个性化分类推荐方法(57)摘要本发明公开了一种基于深度学习的音乐个性化分类推荐方法,包括对乐库中用户操作多的音乐建立向量模型来推荐相似音乐,同时训练一个深度网络模型分析音乐频谱图使用户操作数少的音乐也能有效地按用户喜好分类推荐。本方法主要利用了用户操作反馈和音乐频谱,能有效地避免人工建立复杂的音乐标签,同时对不同操作数的音乐区分操作,可以解决音乐新加入乐库的冷启动问题。CN109271550ACN109271550A权利要求书1/2页1.一种基于深度学习的音乐个性化分类推荐方法,其特征在于,包括如下步骤:S1记录每个用户收听音乐过程中表示收听感受的操作,获得表示用户喜好的歌曲列表;S2筛选出收听操作数多的高频次音乐列表,用适量多用户的高频次音乐列表训练音乐向量模型;S3对音乐向量模型进行用户喜好聚类;S4为收听操作数少的歌曲生成音乐频谱图;S5训练深度网络对频谱图进行用户喜好分类;S6通过用户喜好的歌曲列表计算具体用户的喜好类别并为其推荐同类相似歌曲。2.根据权利要求1所述的一种基于深度学习的音乐个性化分类推荐方法,其特征在于,所述S1还包括对用户的操作细分,建立操作分级区分用户对歌曲的喜欢程度,从大到小为:“分享”>“收藏”>“试听”>“跳过”;并分别建立“分享”音乐列表、“收藏”音乐列表;然后根据不同的列表进行其余步骤,给用户进行更有层次音乐筛选和推荐。3.根据权利要求1所述的一种基于深度学习的音乐个性化分类推荐方法,其特征在于,所述S2中,筛选出收听操作数多的高频次音乐列表,用大量用户的高频次音乐列表训练音乐向量模型,具体包含如下步骤:S2.1统计所有音乐的操作频次,筛选出高频次音乐集合VH和低频次音乐集合VL;筛选出每个用户列表中属于VH的高频次音乐构成列表l,作为音乐向量模型的训练数据;S2.2给定一个音乐列表l,由音乐s1,s2,…,sT构成,T为音乐列表l包含的音乐总数,其概率模型可表示为其中的Contexti表示的音乐si的上下文,视为列表内该音乐前后w首音乐,w能根据实验效果调整得出,i的取值为1~T;首先将每首音乐按均匀分布初始化为统一维度的向量,然后构建一个只有一个隐层的全连接神经网络神经网络,输入为音乐向量,输出为Contexti包含的2w个音乐向量;S2.3以xi输入为例,对应一组训练样本,xi为输入,为正样本,其余为k-1个负样本,根据歌曲出现频率随机采样负样本;目标函数为噪声对比估计函数(noise-contrastiveestimation(NCE)):其中,为正例的概率,为负例的概率,目标函数的含义是尽可能让真实的正例目标词获得高概率,而k个负例噪声词获得低概率;使用随机梯度上升训练S2.2中的神经网络模型,并得到相应的VH音乐向量。4.根据权利要求1所述的一种基于深度学习的音乐个性化分类推荐方法,其特征在于,2CN109271550A权利要求书2/2页步骤S2.2中,根据所述概率模型,设计一个三层的神经网络学习音乐之间的关系;将每首音乐按均匀分布初始化为统一维度的向量,第一层输入层为包含的音乐向量,第二层投影层将音乐向量相加,第三层输出层为音乐向量。5.根据权利要求1所述的一种基于深度学习的音乐个性化分类推荐方法,其特征在于,所述S3具体为:对S2获得的音乐向量进行T-SNE降维,使用聚类方法,对降维后的歌曲聚集成k簇,表示k个依据用户喜好划分的音乐种类,k根据乐库大小适当调整。6.根据权利要求3所述的一种基于深度学习的音乐个性化分类推荐方法,其特征在于,所述S4包括如下步骤:S4.1将VL中的音乐文件统一混音为单声道进行分析,对音频信号进行短时傅里叶变换获得频谱,然后将普通的频率标度转化为更适应人耳感知的梅尔频率标度,映射关系如下式所示:mel(f)=2595*log(1+f/700)每首音乐可以获得宽度固定,长度与音乐时间正相关的梅尔频谱图;S4.2构造卷积神经网络模型,典型的卷积神经网络包括输入层、卷积层、子采样层、全连接层和输出层;为S3中获得的音乐分类构建训练集和测试集