预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共21页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113724709A(43)申请公布日2021.11.30(21)申请号202111016289.2(22)申请日2021.08.31(71)申请人北京字跳网络技术有限公司地址100190北京市海淀区紫金数码园4号楼2层0207(72)发明人蒋泳森(74)专利代理机构北京远智汇知识产权代理有限公司11659代理人范坤坤(51)Int.Cl.G10L15/26(2006.01)G10L15/02(2006.01)权利要求书2页说明书16页附图2页(54)发明名称文本内容匹配方法、装置、电子设备及存储介质(57)摘要本公开实施例公开了一种文本内容匹配方法、装置、电子设备及存储介质,该方法包括:在采集到待处理语音信息时,确定与待处理语音信息相对应的待处理声学特征;基于音频跟随方法对待处理声学特征进行处理,得到与待处理声学特征相对应的待匹配语句;确定待匹配语句在目标文本中所关联的目标语句,并将目标语句在目标文本中区别显示。本公开实施例的技术方案,解决了现有技术中提词器仅仅起到展示播报文本,无法对用户进行有效提示,导致提示效果不佳的问题,实现了在目标用户播报的过程中,采集播报用户的语音信息,并根据语音信息确定其在播报文本中的具体位置,并将其区别显示在提词器上,达到了提词器可以智能跟随播报用户的技术效果。CN113724709ACN113724709A权利要求书1/2页1.一种文本内容匹配方法,其特征在于,包括:在采集到待处理语音信息时,确定与所述待处理语音信息相对应的待处理声学特征;基于音频跟随方法对所述待处理声学特征进行处理,得到与所述待处理声学特征相对应的待匹配语句;确定所述待匹配语句在目标文本中所关联的目标语句,并将所述目标语句在所述目标文本中区别显示。2.根据权利要求1所述的方法,其特征在于,还包括:上传所述目标文本,以在采集到待处理语音信息时,确定所述待处理语音信息所对应的待匹配语句在所述目标文本中所关联的目标语句。3.根据权利要求1所述的方法,其特征在于,所述在采集到待处理语音信息时,确定与所述待处理语音信息相对应的待处理声学特征,包括:在用户基于实时互动界面互动时,采集目标用户的待处理语音信息;基于音频特征提取算法对所述待处理语音信息进行特征提取,得到所述待处理声学特征。4.根据权利要求1所述的方法,其特征在于,所述基于音频跟随方法对所述待处理声学特征进行处理,得到与所述待处理声学特征相对应的待匹配语句,包括:根据所述音频跟随方法中的声学模型对所述待处理声学特征进行处理,得到与所述待处理声学特征相对应的声学后验概率;基于所述声学后验概率和所述音频跟随方法中与目标文本相对应的解码器,确定与所述待处理声学特征相对应的第一待确定语句,和与所述第一待确定语句相对应的第一置信度;其中,所述解码器是根据与所述目标文本相对应的插值语言模型确定,所述插值语言模型是根据与目标文本相对应的目标语言模型和普通语言模型确定的;在所述第一置信度满足预设置信度阈值的条件下,将所述第一待确定语句作为所述待匹配语句。5.根据权利要求1所述的方法,其特征在于,所述基于音频跟随方法对所述待处理声学特征进行处理,得到与所述待处理声学特征相对应的待匹配语句,包括:基于所述音频跟随方法中的关键词检测系统和所述待处理声学特征,确定与所述待处理声学特征相对应的第二待确定语句和与所述第二待确定语句相对应的第二置信度;其中,所述关键词检测系统与所述目标文本相匹配;在所述第二置信度满足预设置信度阈值的条件下,将所述第二待确定语句作为所述待匹配语句。6.根据权利要求1所述的方法,其特征在于,所述基于音频跟随方法对所述待处理声学特征进行处理,得到与所述待处理声学特征相对应的待匹配语句,包括:在所述音频跟随方法中包括关键词检测系统和解码器,且分别基于所述解码器和关键词检测系统对所述待处理声学特征进行处理,得到第一待确定语句和第二待确定语句的条件下,根据所述第一待确定语句的第一置信度和所述第二待确定语句的第二置信度,确定所述待匹配语句。7.根据权利要求1所述的方法,其特征在于,所述将所述目标语句区别显示,包括:将所述目标语句高亮显示;或,2CN113724709A权利要求书2/2页将所述目标语句加粗显示;或,将除所述目标语句之外的其他语句以半透明的形式显示;其中,与所述目标语句相邻的预设数量的未匹配语句的透明度低于其他未匹配语句的透明度。8.根据权利要求1所述的方法,其特征在于,在确定目标语句的过程中,还包括:确定与所述目标语句所对应的实际语音时长;根据所述实际语音时长和所述目标文本中的未匹配语句,调整与所述未匹配语句相对应的预测语音时长;将所述预测语音时长显示在目标客户端上,以对所述目标用户进行提示。9