预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共11页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN105718509A(43)申请公布日2016.06.29(21)申请号201610015143.9(22)申请日2016.01.11(71)申请人北京交通大学地址100044北京市海淀区上园村3号(72)发明人柯新生(74)专利代理机构北京卫平智业专利代理事务所(普通合伙)11392代理人董琪(51)Int.Cl.G06F17/30(2006.01)权利要求书2页说明书6页附图2页(54)发明名称一种基于有向图关联规则音乐云推荐算法(57)摘要本发明涉及一种基于有向图关联规则音乐云推荐算法,通过对音乐云运营数据进行数据建模分析,为商业运营部门的音乐市场分析与辅助决策提供技术手段和服务。通过挖掘最大频繁项集可以有效地提高挖掘的效率和降低问题解的规模。算法利用深度优先的搜索方法,分别选择有向项集图结点集中的结点作为初始结点进行搜索,通过对每一个项集的频繁扩展集进行判断,可以有效地缩小问题空间,减少待检验的最大频繁项集的候选集的数目,有效地提高了算法的效率。通过调整有向项集图的结点集的排列顺序和有向边的生成顺序以及设计有效地最大频繁项集的存储方式进一步优化和提高了算法的效率。CN105718509ACN105718509A权利要求书1/2页1.一种基于有向图关联规则音乐云推荐算法,其特征在于,包括如下步骤:A:建立数据库建立数据库的流程包括:建立关系型数据库、Hbase型数据库,以及从关系型数据库向Hbase型数据库迁移;B构建有向图关联规则算法B1制订支持度计算策略;B2构建有向图的存储方式;B3一般有向图关联构建;B4完全频繁项集有向图构建:依据频繁项集的子集都是频繁项集,非频繁项集的超集都是非频繁项集,在有向项集图存储的1,2项频繁集的基础上进行项集并操作和支持该项集的交易列表的交操作便发现所有频繁项集;B5最大频繁项集的有向图构建。2.如权利要求1所述的基于有向图关联规则音乐云推荐算法,其特征在于:建立数据库的具体步骤为:A1建立关系型数据库:以音乐特征元组为元素,用二位表型的关系模型数据库表示音乐特征数据及其数据之间的联系;A2建立Hbase型数据库:建立基于列储存的分布式Hbase型数据库,以便能后期轻松改变硬件数量,提高错误兼容性;A3从关系型数据库向Hbase型数据库迁移。3.如权利要求2所述的基于有向图关联规则音乐云推荐算法,其特征在于:从关系型数据库向Hbase型数据库迁移的具体步骤为:A31由解析器(Schemaparser)解析由外部工具把传统RDBMS(关系数据库管理系统)数据库导出的表模式定义文档;A32用表模式转换器(Convertor)把传统RDBMS的表模式定义转换成Hbase的表模式;A33用表模式适配器(Adapter)保存、读取已经由表模式转换器所转换过的表模式定义到指定文件中,并为其他模块查找新的表模式定义提供接口;A34用数据表管理器(TableManager)把从初在传统RDBMS数据库中的数据迁移到Hbase数据库中对应新定义的表中;A35令在关系型数据库中原有的表集合为A,迁移后的在HBase数据库中的表集合为B。4.如权利要求1所述的基于有向图关联规则音乐云推荐算法,其特征在于:制订支持度计算策略的具体步骤为:B11设计Tidlist存储方式:定义一个关联项的Tidlist的长度与其数据库中交易数相等,用n个二进制位来表示一个项的Tidlist,即n/8个字节;每一个字节中的一个位取值0、1对应数据库中相应的交易不支持或支持项。5.如权利要求1所述的基于有向图关联规则音乐云推荐算法,其特征在于:构建有向图的存储方式的具体步骤为:B21使用邻接矩阵存储表示图G=(V,E)各顶点信息之间的关系矩阵,用定义:如果(i,j)∈E,则A.edge[i][j](该边权值)的值取1,否则为0;B211保存节点中有与其边关联的另一顶点的下标和指向同一链表中的下一个边结点2CN105718509A权利要求书2/2页的指针;B212保存该边权值。6.如权利要求1所述的基于有向图关联规则音乐云推荐算法,其特征在于:一般有向图关联构建的具体步骤为:B31确定有向图的结点:将所有大于最小支持度s的项按支持度降序排列组成有向项集图的结点V={B,E,A,C,D};B32添加有线图中的弧:按顺序从结点集V中选择一个结点作为出发结点;B33依次选择点为出发结点,删除支持度不符合的点,直到结点集为空。7.如权利要求1所述的基于有向图关联规则音乐云推荐算法,其特征在于:完全频繁项集有向图构建的具体步骤为:B41定义候选集:一个项集的所有子集的支持度均大于或等于最小支持度的频繁项集为候选集;B42有且只有n项频繁项集{V1,V2,…,Vn}