预览加载中,请您耐心等待几秒...
1/9
2/9
3/9
4/9
5/9
6/9
7/9
8/9
9/9

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN112259103A(43)申请公布日2021.01.22(21)申请号202011131092.9(22)申请日2020.10.21(71)申请人戴姆勒股份公司地址德国斯图加特(72)发明人戚耀文(74)专利代理机构北京永新同创知识产权代理有限公司11376代理人慕弦(51)Int.Cl.G10L15/30(2013.01)G10L17/04(2013.01)G10L17/22(2013.01)G06K9/20(2006.01)G06K9/62(2006.01)权利要求书1页说明书5页附图2页(54)发明名称基于多媒体对象的语音交互方法、系统、车辆和程序载体(57)摘要本发明涉及数字信息处理领域。本发明提供一种基于多媒体对象、例如名片的语音交互的方法,所述方法包括以下步骤:获取多媒体对象;提取多媒体对象包含的信息;将所提取的信息关联到至少一个语音技能模型;以及根据用户的语音指令输出所述至少一个语音技能模型对应的语音服务。本发明还涉及一种基于多媒体对象的语音交互的系统、一种相应的车辆和一种机器可读程序载体。本发明旨在将从多媒体对象提取的信息匹配到适合的语音技能模型并利用所述信息对其进行训练,从而用户能够通过语音交互直接定向到语音技能模型并调用相关语音服务,由此实现了一种更高效、快捷的信息处理方式。CN112259103ACN112259103A权利要求书1/1页1.一种基于多媒体对象的语音交互的方法,所述方法包括以下步骤:S1)获取多媒体对象;S2)提取多媒体对象包含的信息;S3)将所提取的信息关联到至少一个语音技能模型;以及S4)根据用户的语音指令输出所述至少一个语音技能模型对应的语音服务。2.根据权利要求2所述的方法,其中,所述步骤S3包括:根据所提取的信息中的表征多媒体对象的主体身份的信息生成标识符;为所提取的信息中的附加信息分配所述标识符,使得所述附加信息及其关联的语音技能模型链接到所述主体身份。3.根据权利要求1或2所述的方法,其中,所述步骤S3包括:将所提取的信息中的人员姓名、职业、物理地址、电子邮件地址、手机号码、固话号码关联到通讯录模型和/或日历模型;以及将所提取的信息中的物理地址关联到天气模型和/或导航模型。4.根据权利要求1至3中任一项所述的方法,其中,所述步骤S3还包括:将多媒体对象的所提取的信息存储到语音技能模型的语料库中并作为训练数据来训练相应的语音技能模型。5.根据权利要求1至4中任一项所述的方法,其中,所述步骤S2包括:借助光学字符识别技术识别多媒体对象中的文本字段;对所述文本字段进行预处理;对所述文本字段执行特征选择;以及按照预定义的标准对所选择的特征进行分类。6.根据权利要求1至5中任一项所述的方法,其中,在步骤S4之前还执行以下步骤:将所关联的语音技能模型存储在云端并且与用户的身份信息进行绑定。7.根据权利要求1至6中任一项所述的方法,其中,所述步骤S4包括:检测用户的语音指令中的第一字段信息和第二字段信息,所述第一字段信息表征用户意图,所述第二字段信息表征多媒体对象的主体身份;基于第一字段信息定向到至少一个语音技能模型,基于第二字段信息定向到所述语音技能模型的语料库中的条目,所述条目链接到所述主体身份;以及借助所述语音技能模型基于所述条目来提供语音服务。8.一种基于多媒体对象的语音交互的系统(100),所述系统用于执行根据权利要求1至7中任一项所述的方法,所述系统(100)包括:获取模块(110),其配置成能够获取多媒体对象;提取模块(120),其配置成能够提取多媒体对象包含的信息;处理模块(130),其配置成将所提取的信息关联到至少一个语音技能模型;以及输出模块(140),其配置成能够根据用户的语音指令输出所述至少一个语音技能模型对应的语音服务。9.一种车辆,所述车辆具有根据权利要求8所述的系统(100)。10.一种机器可读程序载体,在其上存储有计算机程序,所述计算机程序用于当其在计算机上运行时能够实施根据权利要求1至7中任一项所述的方法。2CN112259103A说明书1/5页基于多媒体对象的语音交互方法、系统、车辆和程序载体技术领域[0001]本发明涉及一种基于多媒体对象的语音交互的方法、一种基于多媒体对象的语音交互的系统、一种相应的车辆和一种机器可读程序载体。背景技术[0002]随着个人智能化设备的普及与发展,将纸质媒体对象的信息以电子方式进行存储和读取逐渐成为主流。但是,提取媒体对象的信息往往需要耗费大量人力和物力,如何自动化地完成这一过程并且良好地利用提取出的信息至关重要。[0003]为了解决这一问题,现有技术中提出了基于媒体消息的智能助理以及自动化名片识别方法,其中,尤其提出了可通过图像识别等手段录