预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共20页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN106649811A(43)申请公布日2017.05.10(21)申请号201611243896.1(22)申请日2016.12.29(71)申请人广州酷狗计算机科技有限公司地址510000广东省广州市天河区科韵路16号B1栋13F(72)发明人刘卓(74)专利代理机构北京三高永信知识产权代理有限责任公司11138代理人郭晶(51)Int.Cl.G06F17/30(2006.01)权利要求书3页说明书12页附图4页(54)发明名称构建乐谱库的方法和装置(57)摘要本发明公开了一种构建乐谱库的方法和装置,属于网络通信技术领域。方法包括:从目标网站中爬取乐谱,以及,从所述目标网站中爬取所述乐谱对应的多媒体文件的标识;根据所述多媒体文件的标识,获取所述多媒体文件;根据所述乐谱和所述多媒体文件,验证所述乐谱与所述多媒体文件是否匹配;如果所述乐谱与所述多媒体文件匹配,将所述乐谱和所述多媒体文件的标识的对应关系添加到乐谱库中。装置包括:第一爬取模块,第二爬取模块,第一获取模块,验证模块和第一添加模块。本发明通过验证乐谱与多媒体文件是否匹配,将匹配的乐谱和多媒体文件的标识的对应关系添加到乐谱库中,提高了多媒体服务器构建乐谱库的准确性。CN106649811ACN106649811A权利要求书1/3页1.一种构建乐谱库的方法,其特征在于,所述方法包括:从目标网站中爬取乐谱,以及,从所述目标网站中爬取所述乐谱对应的多媒体文件的标识;根据所述多媒体文件的标识,获取所述多媒体文件;根据所述乐谱和所述多媒体文件,验证所述乐谱与所述多媒体文件是否匹配;如果所述乐谱与所述多媒体文件匹配,将所述乐谱和所述多媒体文件的标识的对应关系添加到乐谱库中。2.根据权利要求1所述的方法,其特征在于,所述根据所述乐谱和所述多媒体文件,验证所述乐谱与所述多媒体文件是否匹配,包括:根据所述乐谱和所述多媒体文件,通过预设相似度算法,确定所述乐谱和所述多媒体文件之间的相似度;如果所述相似度超过预设阈值,确定所述乐谱与所述多媒体文件匹配。3.根据权利要求2所述的方法,其特征在于,所述根据所述乐谱和所述多媒体文件,通过预设相似度算法,确定所述乐谱和所述多媒体文件之间的相似度之前,所述方法还包括:获取预设数目的样本乐谱、每个样本乐谱对应的多媒体文件,以及,所述每个样本乐谱和每个多媒体文件之间的相似度;根据所述每个样本乐谱、所述每个样本乐谱对应的多媒体文件,以及,所述每个样本乐谱和每个多媒体文件之间的相似度,通过迭代算法,对所述预设相似度算法进行优化。4.根据权利要求1所述的方法,其特征在于,所述将所述乐谱和所述多媒体文件的标识的对应关系添加到乐谱库中之前,所述方法还包括:将指定标注信息添加到所述乐谱中,所述指定标注信息用于标注多媒体服务器。5.根据权利要求1所述的方法,其特征在于,所述将所述乐谱和所述多媒体文件的标识的对应关系添加到乐谱库中之后,所述方法还包括:接收终端发送的反馈信息,所述反馈信息中包括所述乐谱中待校正的音符标识和校正后的音符;根据所述音符标识,将所述乐谱中待校正的音符修改为所述校正后的音符。6.根据权利要求5所述的方法,其特征在于,所述根据所述音符标识,将所述乐谱中待校正的音符修改为所述校正后的音符之前,所述方法还包括:统计接收所述反馈信息的接收次数;如果所述接收次数超过预设次数,执行所述根据所述音符标识,将所述乐谱中待校正的音符修改为所述校正后的音符的步骤。7.根据权利要求1所述的方法,其特征在于,所述从目标网站中爬取乐谱,包括:获取所述目标网站的标识,根据所述目标网站的标识,获取所述目标网站中乐谱所在的位置信息;根据所述目标网站的标识和所述位置信息,在所述目标网站中确定所述位置信息对应的爬取区域;从所述爬取区域中爬取所述乐谱。8.根据权利要求7所述的方法,其特征在于,所述从所述爬取区域中爬取所述乐谱,包括:2CN106649811A权利要求书2/3页从所述爬取区域中爬取包含所述乐谱的图像;从所述图像中识别出所述乐谱的音符序列和节拍标识,将所述音符序列和所述节拍标识组成所述乐谱。9.根据权利要求1所述的方法,其特征在于,所述从所述目标网站中爬取所述乐谱对应的多媒体文件的标识,包括:从所述目标网站中的指定区域爬取文字信息,从所述文字信息中提取所述乐谱对应的多媒体文件的标识。10.根据权利要求1所述的方法,其特征在于,如果从所述目标网站中没有爬取到所述多媒体文件的标识,所述方法还包括:根据所述乐谱,从多媒体文件库中选择与所述乐谱匹配的多媒体文件;将所述乐谱和选择的多媒体文件的标识的对应关系添加到乐谱库中。11.根据权利要求10所述的方法,其特征在于,所述根据所述乐谱,从多媒体文件库中选择与所