一种语音交互的实现方法-豆柴文库

一种语音交互的实现方法.pdf

2023-06-26

10金币

296KB

7页

努力****爱静

实名认证

内容提供者

1/7

2/7

3/7

4/7

5/7

6/7

7/7

在线预览结束，喜欢就下载吧，查找使用更方便

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN107368473A(43)申请公布日2017.11.21(21)申请号201710651959.5(22)申请日2017.08.02(71)申请人杜爽地址215000江苏省苏州市虎丘区以升路58号21幢1103室(72)发明人杜爽(74)专利代理机构苏州广正知识产权代理有限公司32234代理人张利强(51)Int.Cl.G06F17/27(2006.01)G06F17/28(2006.01)G06F17/30(2006.01)G10L15/22(2006.01)权利要求书1页说明书4页附图1页(54)发明名称一种语音交互的实现方法(57)摘要本发明公开了一种语音交互的实现方法，包括以下步骤，步骤一，语义识别节点库的建立；步骤二，语义识别节点库加载；步骤三，语音信号处理，对输入的语音信号进行数字处理并形成多个文字串；步骤四，语义识别节点库匹配，语义识别节点库与文字串进行匹配，如果匹配成功，则返回结果从文字串本身转变成相应节点ID，如果匹配失败，则视为识别错误处理并结束；步骤五，语音库匹配成功，按照相应ID节点的返回结果进行语音播报，播报完成并结束语音交互过程。上述一种语音交互的实现方法实现同一语义多种问询方法归一成为一个节点，在语音识别的同时，能直接匹配答案，形成语音识别，语义分析，答案匹配结合在一起的一站式语音交互过程。CN107368473ACN107368473A权利要求书1/1页1.一种语音交互的实现方法，其特征在于：包括以下步骤，步骤一，语义识别节点库的建立，所述语义识别节点库包括多个语音交互定义节点，通过将同一个语义的不同表达方式整合成一种逻辑表达公式，公式直接映射定义答案，从而形成一个基于xml的语音交互定义节点；步骤二，语义识别节点库加载，完成系统中的语义识别节点库的完全加载动作；步骤三，语音信号处理，对输入的语音信号进行数字处理并形成多个文字串；步骤四，语义识别节点库匹配，语义识别节点库与文字串进行匹配，如果匹配成功，则返回结果从文字串本身转变成相应节点ID，如果匹配失败，则视为识别错误处理并结束；步骤五，语音库匹配成功，按照相应ID节点的返回结果进行语音播报，播报完成并结束语音交互过程。2.根据权利要求1所述的一种语音交互的实现方法，其特征在于：所述步骤一中的语音交互定义节点的定义方式具体为，首先预先定义节点ID、节点主题以及节点答案，然后根据所需定义节点的具体语义定义逻辑表达式，所述逻辑表达式包括多个同级别的不同表达方式的可选择项，且在每个选择项中进行具体的逻辑定义，如若能正确识别匹配任何一个表达方式的可选择项，则返回节点答案。3.根据权利要求2所述的一种语音交互的实现方法，其特征在于：所述逻辑表达式包括第一定义符、第二定义符、第三定义符、第四定义符、第五定义符以及关键语义词，通过将第一定义符、第二定义符、第三定义符、第四定义符、第五定义符以及关键语义词进行任意的嵌套或组合或排列并形成不同表达方式的可选择项，通过第一定义符、第二定义符与同级别的不同表达方式的可选择项进行组合并形成逻辑表达式，在第一定义符内罗列同义词或同级别的可选择项，通过第二定义符分割一组同义词或同级别可选择项，在第三定义符内设置可省略项，第四定义符可代替任意文字，第五定义符为处理单元之间的区分符号。4.根据权利要求3所述的一种语音交互的实现方法，其特征在于：所述第一定义符设置为方括号，所述第二定义符设置为大括号，第三定义符设置为逗号，所述第四定义符设置为星号，第五定义符设置为空格符。5.根据权利要求1所述的一种语音交互的实现方法，其特征在于：所述基于xml的语音交互定义节点是经过人工事先进行语义分析，并提高语义分析准确率到100%，继而形成的人工定义节点。2CN107368473A说明书1/4页一种语音交互的实现方法[0001]技术领域：本发明涉及一种语音交互的实现方法，涉及人工智能技术领域。[0002]背景技术：语音识别技术，也被称为自动语音识别AutomaticSpeechRecognition，(ASR)，其目标是将人类的语音中的词汇内容转换为计算机可读的输入，1920年，一款名为RadioRex的玩具狗应该可以被看做是最早的语音识别器，因为当这只狗的名字被呼唤的时候，它能够以“从底座上弹出来”这样的动作进行反应。1952年由AT&T贝尔实验室开发的Audrey语音识别系统，它能够识别10个英文数字。1960年代，人工神经网络被引入了语音识别。这一时代的两大突破是线性预测编码LinearPredictiveCoding(LPC)，及动态时间规整DynamicTimeWarp技术。80年代后，研究的重点逐渐转向大词汇量、非特定人连续语音识别。在研究思路上也

相关资料

一种语音交互的实现方法.pdf

本发明公开了一种语音交互的实现方法，包括以下步骤，步骤一，语义识别节点库的建立；步骤二，语义识别节点库加载；步骤三，语音信号处理，对输入的语音信号进行数字处理并形成多个文字串；步骤四，语义识别节点库匹配，语义识别节点库与文字串进行匹配，如果匹配成功，则返回结果从文字串本身转变成相应节点ID，如果匹配失败，则视为识别错误处理并结束；步骤五，语音库匹配成功，按照相应ID节点的返回结果进行语音播报，播报完成并结束语音交互过程。上述一种语音交互的实现方法实现同一语义多种问询方法归一成为一个节点，在语音识别的同时，

2023-06-26

296KB

一种语音点歌交互系统及语音点歌交互方法.pdf

本发明公开一种语音点歌交互系统及语音点歌交互方法，系统包括蓝牙设备、通信控制设备和云端服务器，蓝牙设备与通信控制设备蓝牙连接，通信控制设备与云端服务器通信连接；方法包括以下步骤：1）蓝牙设备将拾取用户语音得的语音文件发送至通信控制设备；2）通信控制设备判断语音文件是否有唤醒词；3）云端服务器分析由语音文件转化得到的文字文件并根据结果进行检索和/或形成控制指令；4）云端服务器将歌曲播放地址和/或控制指令发送至通信控制设备，通信控制设将歌曲缓冲数据发送至蓝牙设备播放和/或通信控制设备解析控制指令并发送至蓝牙设

2023-12-05

459KB

用于实现语音竞猜游戏的交互方法.pdf

本发明涉及语音游戏领域，本发明旨在解决现有的语音竞猜游戏存在趣味性和娱乐性不足的问题，提出一种用于实现语音竞猜游戏的交互方法，包括：获取原始数据；从属性数据中筛选出具有区分度的属性及其属性值，并对选取的数据进行数据清洗；对选取的属性及其属性值进行统计，对原始数据集进行划分；根据排名前五的属性进行随机提问；根据玩家的回答对猜测对象进行筛选，筛选后得到备选项集合，判断已提问次数是否等于最大属性提问数，判断备选项集合中猜测对象的数量是否大于预设阈值；判断所述备选项集合中猜测对象的数量是否大于1，最后根据玩家的回

2023-12-03

349KB

一种通过语音交互实现数据可视化的方法.pdf

本发明公开了一种通过语音交互实现数据可视化的方法，用以解决目前的数据可视化的实现方法门槛较高，相对费时的情况。所述方法包括：数据可视化需求模块向数据检索模块发送检索需求；数据检索模块根据所述检索需求在数据库中检索数据元素，并将检索到的数据元素发送至数据处理模块；数据处理模块根据检索需求或所述检索到的数据元素确定视觉特征，并将所述检索到的数据元素映射到所述视觉特征上得到显示文档框架；渲染模块根据所述显示文档框架输出显示。本发明提高的方法能极大的提高数据可视化效率，降低用户进行数据可视化处理的门槛，节约进行数

2024-01-06

465KB

一种语音交互方法及装置.pdf

本申请实施例提供了一种语音交互方法及装置。所述方法包括：接收语音信号，作为目标语音信号；检测所述目标语音信号中是否包含用户语音；如果是，则确定环境中的噪声音量；根据所述噪声音量，响应目标用户语音对应的交互指令，所述目标用户语音为所述目标语音信号中包含的用户语音。应用本申请实施例提供的方案，能够提高语音交互过程的流畅性，提高用户体验。

2024-01-04

499KB