预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN111626041A(43)申请公布日2020.09.04(21)申请号202010379417.9(22)申请日2020.05.07(71)申请人杭州东信北邮信息技术有限公司地址310013浙江省杭州市西湖区文三路398号4层(72)发明人黄璜赵海秀张少杰王彦青王为强(51)Int.Cl.G06F40/205(2020.01)G06F40/216(2020.01)G06F40/284(2020.01)G06F40/30(2020.01)G06F16/68(2019.01)G06F16/951(2019.01)G06K9/62(2006.01)权利要求书2页说明书4页附图3页(54)发明名称一种基于深度学习的音乐评论生成方法(57)摘要一种基于深度学习的音乐评论生成方法,包括:使用网络爬虫技术,获取音乐原始评论,构建音乐评论库;基于Bert模型和Transformer模型,构建文本摘要生成模型,将待评论音乐的歌词文本输入文本摘要生成模型,获得歌词摘要文本;判断音乐评论库中所有音乐的原始评论中是否存在有待评论音乐的音乐名或歌手名,如果是,则挑选出存在有音乐名或歌手名的原始评论,如果否,则计算待评论音乐的歌词摘要文本和音乐评论库中每条音乐的原始评论的文本相似度,并挑选出相似度最高的原始评论;基于VAE模型构建复述生成模型,将挑选出的原始评论输入复述生成模型,生成新的评论文本。本发明属于信息技术领域,能自动生成音乐的评论文本,并提高文本准确度、多样性和流畅度。CN111626041ACN111626041A权利要求书1/2页1.一种基于深度学习的音乐评论生成方法,其特征在于,包括有:步骤一、使用网络爬虫技术,获取音乐原始评论,从而构建音乐评论库,所述音乐评论库用于保存网络上获取到的音乐的原始评论;步骤二、基于Bert模型和Transformer模型,构建sequencetosequence文本摘要生成模型,sequencetosequence文本摘要生成模型的输入是音乐歌词文本,输出是歌词摘要文本,将待评论音乐的音乐歌词文本输入sequencetosequence文本摘要生成模型,并获得对应的歌词摘要文本;步骤三、判断音乐评论库中所有音乐的原始评论中是否存在有待评论音乐的音乐名或歌手名,如果是,则从音乐评论库中挑选出存在有待评论音乐的音乐名或歌手名的原始评论,然后继续下一步;如果否,则计算待评论音乐的歌词摘要文本和音乐评论库中每条音乐的原始评论的文本相似度,并挑选出与待评论音乐的歌词摘要文本的相似度最高的原始评论,然后继续下一步;步骤四、基于VAE模型,构建VAE复述生成模型,VAE复述生成模型的输入是评论文本,输出是生成的复述评论文本,将为待评论音乐挑选出的原始评论输入VAE复述生成模型,从而为待评论音乐生成新的评论文本。2.根据权利要求1所述的方法,其特征在于,步骤一中,还对从网络上获取的音乐原始评论做正则匹配和短语替换的数据清洗操作,其中,短语替换是将音乐原始评论中的音乐名、歌手名的具体指代词用占位符替代,正则匹配是对音乐原始评论的文本信息进行增强,统一文本中的具体指代信息。3.根据权利要求1所述的方法,其特征在于,步骤二进一步包括有:步骤21、将音乐歌词文本分割成多句话,并将每句话再继续分割成多个词,分割得到的每句话或者每个词都是一个语义单元,然后将每个语义单元分别输入Bert模型,获得Bert模型输出的语义特征向量;步骤22、计算每个分割词的位置特征向量:其中,Zpos(i)是词i的位置特征向量,pos是词i在句子中的排序位置,d是向量维度;步骤23、计算每个分割词的文本表示向量:Z(i)=Zpos(i)+Zword(i)+Zsen(i),其中,Z(i)是词i的文本表示向量,Zsen(i)是词i所属句子或窗口序列的语义特征向量,Zword(i)是词i的语义特征向量,当词i所属句子的长度超过句长阈值时,以词i为中心,从其所属句子中截取一个上下文窗口长度的窗口序列,Zsen(i)即是截取的窗口序列的语义特征向量;步骤24、按分割词在音乐歌词文本中的排序位置,依次将每个分割词的文本表示向量输入Transformer模型,并获得Transformer模型输出的歌词摘要序列,从而获得歌词摘要文本。4.根据权利要求3所述的方法,其特征在于,步骤24中还包括有:Transformer模型每次在确定输入参数和之前状态的输出后,输出k个序列,该步骤进一步包括有:Transformer模型每次在确定新输入的分割词的文本表示向量和之前状态的输出序列2CN111626041A权利要求书2/2页后,根据推理找词表中当前选择概率最大的k个词,然后将当前选择概率最大的k个词与