预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共15页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN115019788A(43)申请公布日2022.09.06(21)申请号202210404699.2(22)申请日2022.04.18(71)申请人厦门快商通科技股份有限公司地址361009福建省厦门市集美区软件园三期诚毅北大街63号1301单元(72)发明人刘焕玉肖龙源李稀敏叶志坚(74)专利代理机构厦门仕诚联合知识产权代理事务所(普通合伙)35227专利代理师戴惠恋(51)Int.Cl.G10L15/22(2006.01)G10L15/06(2013.01)G10L25/03(2013.01)G10L25/51(2013.01)G10L25/63(2013.01)权利要求书2页说明书9页附图3页(54)发明名称语音交互方法、系统、终端设备及存储介质(57)摘要本发明提供了一种语音交互方法、系统、终端设备及存储介质,该方法包括:对用户进行语音采集,得到待交互语音,并对所述待交互语音进行属性分析,得到语音属性信息,所述语音属性信息包括年龄、性别和情绪中一种或多种的组合;根据所述语音属性信息确定应答属性信息,并对所述待交互语音进行应答分析,得到应答语音;根据所述应答属性信息对所述应答语音进行语音渲染,得到输出语音,并根据所述输出语音对所述用户进行语音交互。本发明通过将应答属性信息对应答语音进行语音渲染,使得针对不同年龄、性别和/或情绪的用户,能对应进行不同语音状态的应答,提高了语音交互的多样性,进而提高了用户的交互体验。CN115019788ACN115019788A权利要求书1/2页1.一种语音交互方法,其特征在于,所述方法包括:对用户进行语音采集,得到待交互语音,并对所述待交互语音进行属性分析,得到语音属性信息,所述语音属性信息包括年龄、性别和情绪中一种或多种的组合;根据所述语音属性信息确定应答属性信息,并对所述待交互语音进行应答分析,得到应答语音;根据所述应答属性信息对所述应答语音进行语音渲染,得到输出语音,并根据所述输出语音对所述用户进行语音交互。2.如权利要求1所述的语音交互方法,其特征在于,所述对所述待交互语音进行属性分析,得到语音属性信息,包括:获取模型训练样本,并对所述模型训练样本分别进行年龄、性别和情绪的标注,得到年龄标注信息、性别标注信息和情绪标注信息;根据所述年龄标注信息对年龄段识别模型进行模型训练,直至所述年龄段识别模型收敛;根据所述性别标注信息对性别识别模型进行模型训练,直至所述性别识别模型收敛;根据所述情绪标注信息对情绪识别模型进行模型训练,直至所述情绪识别模型收敛;根据收敛后的所述年龄段识别模型、所述性别识别模型和所述情绪识别模型分别对所述待交互语音进行分析,得到用户年龄、用户性别和用户情绪;其中,所述语音属性信息包括所述用户年龄、所述用户性别和所述用户情绪。3.如权利要求1所述的语音交互方法,其特征在于,所述根据所述语音属性信息确定应答属性信息,包括:将所述用户年龄、所述用户性别和所述用户情绪分别与预存储的属性查询表进行匹配,得到应答年龄、应答性别和应答情绪;其中,所述应答属性信息包括所述应答年龄、所述应答性别和所述应答情绪,所述属性查询表中存储有不同用户年龄与对应应答年龄之间的对应关系,存储有不同性别与对应应答性别之间的对应关系,存储有不同用户情绪与对应应答情绪之间的对应关系。4.如权利要求2所述的语音交互方法,其特征在于,所述对所述待交互语音进行属性分析,得到语音属性信息之后,还包括:分别将所述用户年龄、所述用户性别和所述用户情绪进行组合,得到属性组集合;若所述属性组集合中任一属性组是预设属性组合,则将所述预设属性组合对应的情景应答属性设置为所述应答属性信息。5.如权利要求2所述的语音交互方法,其特征在于,所述对所述待交互语音进行属性分析,得到语音属性信息之前,还包括:对所述用户的当前所处环境进行信息采集,得到环境信息,并提取所述环境信息的特征,得到当前环境特征,所述环境信息包括环境图像、环境语音、环境坐标中一种或多种的组合;将所述用户情绪和所述当前环境特征与预设环境特征进行匹配;若所述用户情绪和所述当前环境特征与所述预设环境特征的匹配合格,则将所述预设环境特征对应的环境应答属性设置为所述应答属性信息。6.如权利要求1所述的语音交互方法,其特征在于,所述方法还包括:2CN115019788A权利要求书2/2页对所述待交互语音进行实体分析,得到语音实体,并将所述语音实体与预存储的隐私词汇表进行匹配,所述隐私词汇表中存储有所述用户预设置的隐私词汇;若所述语音实体与所述隐私词汇表匹配成功,则对所述用户的当前所处环境进行信息采集,得到环境信息,并对所述环境信息进行隐私检测,所述隐私检测用户判断所述用户当前所处环境是否为安全环境;若检测到所