音频识别方法和装置-豆柴文库

音频识别方法和装置.pdf

2023-12-07

10金币

1.9MB

16页

Ch****49

实名认证

内容提供者

1/10

2/10

3/10

4/10

5/10

6/10

7/10

8/10

9/10

10/10

亲，该文档总共16页，到这已经超出免费预览范围，如果喜欢就直接下载吧～

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号(10)申请公布号CN104424946A(43)申请公布日(43)申请公布日2015.03.18(21)申请号201310375575.7(22)申请日2013.08.26(71)申请人中国电信股份有限公司地址100033北京市西城区金融大街31号(72)发明人仝建刚吕冠中(74)专利代理机构中国国际贸易促进委员会专利商标事务所11038代理人刘剑波(51)Int.Cl.G10L15/26(2006.01)G10L15/30(2013.01)权利要求书2页说明书8页附图5页(54)发明名称音频识别方法和装置(57)摘要本发明公开一种音频识别方法和装置。其中音频识别方法包括：采集在播放音频文件时产生的音频信息；提取出隐藏在音频信息中的附加信息；从附加信息中提取出音频文件的标识信息；将标识信息呈现给用户。本发明通过在音频播放过程中采集、滤出并还原音频制作时隐藏在音频信息中的标识信息，从而实现音频的即时识别。该方法适用于通过移动终端上的应用，识别广播、广告、电视和电影中正在播放的音乐，从而提高用户体验。CN104424946ACN104424946A权利要求书1/2页1.一种音频识别方法，其特征在于，包括：采集在播放音频文件时产生的音频信息；提取出隐藏在音频信息中的附加信息；从附加信息中提取出音频文件的标识信息；将标识信息呈现给用户。2.根据权利要求1所述的方法，其特征在于，从附加信息中提取出音频文件的标识信息后，还包括：判断附加信息中是否包括音频文件的下载地址；若附加信息中包括音频文件的下载地址，则利用音频文件的下载地址从网络下载相应的音频文件，并将下载的音频文件和音频文件的标识信息相关联，然后执行将标识信息呈现给用户的步骤。3.根据权利要求2所述的方法，其特征在于，在利用音频文件的下载地址从网络下载相应的音频文件的步骤之后，还包括：判断是否能够在预定的时间范围内完成下载；若能够在预定的时间范围内完成下载，则执行将下载的音频文件和音频文件的标识信息相关联的步骤；若不能在预定的时间范围内完成下载，则利用标识信息，在网络中搜索是否存在与标识信息相关联的音频文件；当搜索到与标识信息相关联的音频文件时，下载与标识信息相关联的音频文件，然后执行将下载的音频文件和音频文件的标识信息相关联的步骤。4.根据权利要求2所述的方法，其特征在于，若附加信息中没有包括音频文件的下载地址，则利用标识信息，在网络中搜索是否存在与标识信息相关联的音频文件；当搜索到与标识信息相关联的音频文件时，下载与标识信息相关联的音频文件，然后执行将下载的音频文件和音频文件的标识信息相关联的步骤。5.根据权利要求1-4中任一项所述的方法，其特征在于，标识信息包括音频文件的音乐名称、作曲作家、作词作家、演唱者、推广信息。6.一种音频识别装置，其特征在于，包括采集单元、第一提取单元、第二提取单元和呈现单元，其中：采集单元，用于采集在播放音频文件时产生的音频信息；第一提取单元，用于提取出隐藏在音频信息中的附加信息；第二提取单元，用于从附加信息中提取出音频文件的标识信息；呈现单元，用于将标识信息呈现给用户。7.根据权利要求6所述的装置，其特征在于，还包括第一判断单元、下载单元和关联单元，其中：第一判断单元，用于在第二提取单元从附加信息中提取出音频文件的标识信息后，判断附加信息中是否包括音频文件的下载地址；下载单元，用于根据第一判断单元的判断结果，在附加信息中包括音频文件的下载地址时，利用音频文件的下载地址从网络下载相应的音频文件；2CN104424946A权利要求书2/2页关联单元，用于将下载单元下载的音频文件和音频文件的标识信息相关联，并指示呈现单元将标识信息呈现给用户。8.根据权利要求7所述的装置，其特征在于，还包括第二判断单元和搜索单元，其中：第二判断单元，用于在下载单元利用音频文件的下载地址从网络下载相应的音频文件后，判断下载单元是否能够在预定的时间范围内完成下载；若下载单元能够在预定的时间范围内完成下载，则指示关联单元执行将下载的音频文件和音频文件的标识信息相关联的操作；搜索单元，用于根据第二判断单元的判断结果，在下载单元不能在预定的时间范围内完成下载时，利用标识信息，在网络中搜索是否存在与标识信息相关联的音频文件；下载单元还用于在搜索单元搜索到与标识信息相关联的音频文件时，下载与标识信息相关联的音频文件，并指示关联单元将下载的音频文件和音频文件的标识信息相关联。9.根据权利要求8所述的装置，其特征在于，搜索单元还用于根据第一判断单元的判断结果，在附加信息中没有包括音频文件的下载地址时，利用标识信息，在网络中搜索是否存在与标识信息相关联的音频文件。10.根据权利要求6-9中任一项所述的装置，其特征在

相关资料

音频识别方法和装置.pdf

本发明公开一种音频识别方法和装置。其中音频识别方法包括：采集在播放音频文件时产生的音频信息；提取出隐藏在音频信息中的附加信息；从附加信息中提取出音频文件的标识信息；将标识信息呈现给用户。本发明通过在音频播放过程中采集、滤出并还原音频制作时隐藏在音频信息中的标识信息，从而实现音频的即时识别。该方法适用于通过移动终端上的应用，识别广播、广告、电视和电影中正在播放的音乐，从而提高用户体验。

2023-12-07

1.9MB

音频识别方法、装置、电子设备和存储介质.pdf

本公开是关于一种音频识别方法、装置、电子设备和存储介质。该方法包括：获取查询内容；所述查询内容包括表征待识别音频的片段信息；从预设库中选取与所述查询内容对应的预设数量的候选音频；所述候选音频包括与所述片段信息相匹配的候选音频片段；将所述候选音频片段输入已训练的检测模型中，得到包含所述片段信息的目标片段信息和所述目标片段信息所在的目标音频。本实施例中可以利用部分片段信息即可从预设库中识别出相匹配的目标音频片段和目标音频，有利于提升识别效率，提高使用体验。

2023-07-25

669KB

音频的识别方法、装置、可读介质和电子设备.pdf

本公开涉及一种音频的识别方法、装置、可读介质和电子设备，涉及电子信息处理技术领域，该方法包括：获取待识别音频，提取用于表征待识别音频的目标音频特征，目标音频特征的维度与待识别音频的时长正相关，利用预先训练的识别模型，根据目标音频特征确定指定维度的统计特征，并根据统计特征确定待识别音频包括的目标音频事件，识别模型根据预先采集的训练音频集训练得到，训练音频集包括不同时长的训练音频。本公开中识别模型对不同时长的音频进行特征提取，以得到指定维度的统计特征，从而识别音频中包括的音频事件，无需对音频进行截取或补齐操作

2023-07-24

705KB

一种音频数据的识别方法和装置.pdf

本发明公开了一种音频数据的识别方法和装置，涉及计算机技术领域。该方法的一具体实施方式包括：将音频数据输入至第一识别模型，根据第一识别模型的输出结果确定多个优选识别结果和最优置信度分数；按照对应的最优置信度分数小于预设第一阈值的选择标准，从音频数据中选出输入至目标识别模型的目标音频数据，以通过目标识别模型得到第二识别结果；将多个优选识别结果输入至序列转换模型中，得到多个序列转换结果；根据多个序列转换结果对第二识别结果进行校验，在校验通过的情况下，将第二识别结果作为音频数据的目标识别结果。该实施方式能够无需依

2023-07-22

697KB

音频识别方法、装置及存储介质.pdf

本发明公开了一种音频识别方法、装置及存储介质，该方法包括：获取音频文件，以及音频文件对应的文本信息，文本信息包括多个字；依次将文本信息中的每个字，设置为目标字，并获取目标字对应的时间信息，时间信息包括目标字的开始时间和目标字的结束时间；根据目标字的开始时间，确定目标字对应的多个开始调整时间，并根据目标字的结束时间，确定目标字对应的多个结束调整时间；根据目标字的多个开始调整时间和目标字的多个结束调整时间，对音频文件进行识别，得到目标字的音高信息。该方案通过在根据目标字对应的开始时间和结束时间，确定多个开始调

2023-12-05

1.2MB