歌词识别方法、装置、电子设备及可读存储介质-豆柴文库

歌词识别方法、装置、电子设备及可读存储介质.pdf

2023-07-24

10金币

465KB

14页

一吃****仕龙

实名认证

内容提供者

1/10

2/10

3/10

4/10

5/10

6/10

7/10

8/10

9/10

10/10

亲，该文档总共14页，到这已经超出免费预览范围，如果喜欢就直接下载吧～

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN114141250A(43)申请公布日2022.03.04(21)申请号202111465773.3(22)申请日2021.12.03(71)申请人广州酷狗计算机科技有限公司地址510655广东省广州市天河区黄埔大道中315号自编1-17(72)发明人洛晋申张培熙党正军(74)专利代理机构北京柏杉松知识产权代理事务所(普通合伙)11413代理人孙翠贤孟维娜(51)Int.Cl.G10L15/26(2006.01)G10L15/14(2006.01)G10L15/16(2006.01)权利要求书2页说明书9页附图2页(54)发明名称歌词识别方法、装置、电子设备及可读存储介质(57)摘要本发明实施例提供了一种歌词识别方法、装置、电子设备及可读存储介质，该方法包括：获取待识别歌词的目标音频；从所述目标音频中，选取待分析音频片段；其中，所述待分析音频片段为属于唱歌类型的片段；对所述待分析音频片段进行语音识别，得到识别结果；基于所得到的识别结果，生成所述目标音频的歌词内容。本方案中，通过选取目标音频中唱歌类型的待分析音频片段后，再对待分析音频片段进行语音识别，从而基于识别结果生成歌词内容，这样可以大大降低唱歌类型以外的音频内容的干扰，因此，通过本方案能够提高歌词识别的准确率。CN114141250ACN114141250A权利要求书1/2页1.一种歌词识别方法，其特征在于，所述方法包括：获取待识别歌词的目标音频；从所述目标音频中，选取待分析音频片段；其中，所述待分析音频片段为属于唱歌类型的片段；对所述待分析音频片段进行语音识别，得到识别结果；基于所得到的识别结果，生成所述目标音频的歌词内容。2.根据权利要求1所述的方法，其特征在于，从所述目标音频中，选取待分析音频片段，包括：从所述目标音频中，提取多个音频片段；其中，所述多个音频片段的片段内容覆盖所述目标音频的音频内容；对各个音频片段进行音频类型识别，得到各个音频片段对应的识别结果；其中，所述音频类型识别所针对的音频类型包括唱歌类型；确定所对应识别结果为唱歌类型的音频片段，作为待分析音频片段。3.根据权利要求2所述的方法，其特征在于，所述对各个音频片段进行音频类型识别，得到各个音频片段对应的识别结果，包括：针对每一音频片段，将该音频片段的音频数据输入预先训练的分类模型，得到该音频片段对应的识别结果；其中，所述分类模型为预先基于样本音频和类型标签所训练的分类模型，所述类型标签包括唱歌类型。4.根据权利要求2所述的方法，其特征在于，所述从所述目标音频中，提取多个音频片段，包括：采用滑动窗口，从所述目标音频中依此选取具有指定长度的各个音频片段，其中，所述指定长度为滑动窗口的窗口大小。5.根据权利要求4所述的方法，其特征在于，所述滑动窗口的滑动步长小于所述窗口大小。6.根据权利要求1‑5任一项所述的方法，其特征在于，所述待分析音频片段的数量为多个；所述对所述待分析音频片段进行语音识别，得到识别结果，包括：若多个待分析音频片段中，存在符合预定整合条件的各个目标片段，则获取各个目标片段对应的整合片段，其中，所述预定整合条件包括：音频时间连续且相邻片段存在重叠的音频时间；所述整合片段为所述目标音频中以第一时间点为起始时间点，以第二时间点为终止时间点的音频片段，所述第一时间点为各个目标片段的起始时间点的最小值，所述第二时间点为各个目标片段的终止时间点的最大值；对所述整合片段以及其他待分析音频片段，分别进行语音识别，得到识别结果；其中，其他待分析音频片段为除各个目标片段以外的待分析音频片段。7.根据权利要求1‑5任一项所述的方法，其特征在于，所述基于所得到的识别结果，生成所述目标音频的歌词内容，包括：对所识别得到的识别结果进行纠错处理；利用纠错处理后的识别结果，构成所述目标音频的歌词内容。2CN114141250A权利要求书2/2页8.一种歌词识别装置，其特征在于，所述装置包括：获取模块，用于获取待识别歌词的目标音频；选取模块，用于从所述目标音频中，选取待分析音频片段；其中，所述待分析音频片段为属于唱歌类型的片段；识别模块，用于对所述待分析音频片段进行语音识别，得到识别结果；生成模块，用于基于所得到的识别结果，生成所述目标音频的歌词内容。9.一种电子设备，其特征在于，包括处理器、通信接口、存储器和通信总线，其中，处理器，通信接口，存储器通过通信总线完成相互间的通信；存储器，用于存放计算机程序；处理器，用于执行存储器上所存放的程序时，实现权利要求1‑7任一所述的方法步骤。10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质内存储有计算机程序，所述计算机程序被处理器执行时实现权利要求1‑7任一所述的方法步骤。3CN114

相关资料

歌词识别方法、装置、电子设备及可读存储介质.pdf

本发明实施例提供了一种歌词识别方法、装置、电子设备及可读存储介质，该方法包括：获取待识别歌词的目标音频；从所述目标音频中，选取待分析音频片段；其中，所述待分析音频片段为属于唱歌类型的片段；对所述待分析音频片段进行语音识别，得到识别结果；基于所得到的识别结果，生成所述目标音频的歌词内容。本方案中，通过选取目标音频中唱歌类型的待分析音频片段后，再对待分析音频片段进行语音识别，从而基于识别结果生成歌词内容，这样可以大大降低唱歌类型以外的音频内容的干扰，因此，通过本方案能够提高歌词识别的准确率。

2023-07-24

465KB

语音识别方法、装置、电子设备及可读存储介质.pdf

本发明提供一种语音识别方法、装置、电子设备及可读存储介质,其中方法包括:每隔预设的时间间隔,获取一次语音采集器采集的语音信息,所述语音采集器实时地采集所述语音信息;获取预分配的存储空间的存储信息,根据所述存储信息、预设的待识别语音包合成策略以及本次获取的所述语音信息,合成所述待识别语音数据;对所述待识别语音数据包进行语音识别,得到本次的语音识别结果;确定与所述语音识别结果对应的目标操作指令,并发送给医疗设备。本发明具有高及时性和高识别效率。

2023-04-19

948KB

实体识别方法、装置、电子设备及可读存储介质.pdf

本公开的实施例提供了一种实体识别方法、装置、电子设备及可读存储介质。所述方法包括：获取预先训练好的实体识别模型和所述实体识别模型的模型参数；调用矩阵运算库重写所述实体识别模型的模型结构，并将所述模型参数赋予重写的实体识别模型，生成目标实体识别模型；获取待识别语句；将所述待识别语句输入至所述目标实体识别模型；调用所述目标实体识别模型输出所述待识别语句中的目标实体词及所述目标实体词的实体类型。本公开的实施例可以在高负载的流量下确保NER服务高承载性，并提高了实体识别的效率和准确率。

2023-07-25

723KB

位置识别方法、装置、电子设备及可读存储介质.pdf

本申请涉及一种位置识别方法、装置、电子设备及可读存储介质,所述方法包括步骤:获取当前位置点对应的初始激光数据,所述初始激光数据为在所述当前位置点进行扫描得到的激光点集合;获取激光子图,并通过所述激光子图对所述初始激光数据进行补充得到当前位置激光数据,所述激光子图基于历史位置点对应的激光数据构建;根据所述当前位置激光数据确定闭环位置点,并确定所述当前位置点与所述闭环位置点之间的转换关系。通过历史位置点对应的激光数据构建激光子图,使得激光子图中能够包含已扫描到的所有激光点的信息,通过激光子图对初始激光数据进行

2023-04-19

561KB

对象识别方法、装置、电子设备及可读存储介质.pdf

本发明实施例提供一种对象识别方法、装置、电子设备及可读存储介质，服务器获取预设时间段内不同时间点的待处理对象的定位数据，根据定位数据确定出POI，然后根据不同时间点和对应的POI得到待处理对象的POI时间序列，进而根据POI时间序列确定待处理对象是否属于目标对象并输出提示信息。该过程中，服务器利用终端设备主动上报的定位数据监控待处理对象，获取到的信息均是真实有效的信息，通过利用真实有效的定位信息对疫情期间待处理对象是否违规复工进行有效监控，实现遏制疫情扩散的目的。

2023-07-25

658KB