预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共16页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN114116771A(43)申请公布日2022.03.01(21)申请号202111437927.8(22)申请日2021.11.29(71)申请人如果科技有限公司地址071000河北省保定市莲池区朝阳南大街2199号(72)发明人李保雷孙旭东宋占亮(74)专利代理机构深圳中一联合知识产权代理有限公司44414代理人李艳丽(51)Int.Cl.G06F16/242(2019.01)G06F16/248(2019.01)G06F40/284(2020.01)G10L15/26(2006.01)权利要求书2页说明书11页附图2页(54)发明名称声控数据分析方法、装置、终端设备及存储介质(57)摘要本申请适用于语音控制技术领域,提供了一种声控数据分析方法、装置、终端设备及存储介质。将语音信息转换为文本信息,对文本信息进行过滤,得到词汇集合;将词汇集合中各个词汇对应的向量带入到预设模型,得到第一输出结果;将语料库中各个语料对应的向量带入预设模型,得到多个第二输出结果;在多个第二输出结果中确定与第一输出结果相似度最高的目标输出结果,对与目标输出结果对应的语料进行编码,得到组合序列;利用抽象语法树对组合序列解码,得到SQL语句;将SQL语句发送至SQL数据库中查询数据,得到数据结果,将数据结果发送至数据大屏的前端页面,以使前端页面根据数据结果更新显示数据,由此实现用户与数据大屏智能化交互。CN114116771ACN114116771A权利要求书1/2页1.一种声控数据分析方法,其特征在于,包括:将语音信息转换为文本信息,并对所述文本信息进行过滤,得到词汇集合;确定所述词汇集合中各个词汇的向量,并将各个所述词汇对应的向量带入到预设模型,得到第一输出结果;确定语料库中各个语料的向量,并将各个所述语料对应的向量带入所述预设模型,得到多个第二输出结果;在多个所述第二输出结果中确定与所述第一输出结果相似度最高的目标输出结果,对与所述目标输出结果对应的语料进行编码,得到组合序列;利用抽象语法树对所述组合序列进行解码,得到SQL语句;将所述SQL语句发送至SQL数据库中查询数据,得到数据结果,将所述数据结果发送至数据大屏的前端页面,以使所述前端页面根据所述数据结果更新显示数据。2.根据权利要求1所述的声控数据分析方法,其特征在于,所述对所述文本信息进行过滤,得到词汇集合,包括:去除所述文本信息中的非文本内容;对去除非文本内容的文本信息进行分词处理,得到多个词汇;对每个词汇进行词性标注;去除停用词,得到所述词汇集合。3.根据权利要求1所述的声控数据分析方法,其特征在于,所述预设模型为word2vec模型、one‑hot模型或TF‑IDF模型。4.根据权利要求1所述的声控数据分析方法,其特征在于,所述在多个所述第二输出结果中确定与所述第一输出结果相似度最高的目标输出结果,对与所述目标输出结果对应的语料进行编码,得到组合序列,包括:计算每个所述第二输出结果与所述第一输出结果的相似度;确定与所述第一输出结果相似度最高的第二输出结果,记作为所述目标输出结果;在语料库中获取与所述目标输出结果对应的目标语料,并根据所述目标语料得到query、table和column在数据库中的表达方式;对query、table和column进行联合编码,得到所述组合序列。5.根据权利要求1所述的声控数据分析方法,其特征在于,所述利用抽象语法树对所述组合序列进行解码,得到SQL语句,包括:将所述组合序列进行语法解析,得到目标抽象语法树;根据预设规则对所述目标抽象语法树中各个节点上的语料进行转换;根据转换后的所述目标抽象语法树,得到所述SQL语句。6.根据权利要求1至5任一项所述的声控数据分析方法,其特征在于,在所述将语音信息转换为文本信息,并对所述文本信息进行过滤,得到词汇集合之前,还包括:提取所述语音信息的特征信息,并根据所述特征信息识别所述语音信息对应的身份;在所述语音对应的身份为主讲人时,执行所述将语音信息转换为文本信息,并对所述文本信息进行过滤,得到词汇集合步骤;在所述语音信息的身份为非主讲人时,则不执行所述将语音信息转换为文本信息,并对所述文本信息进行过滤,得到词汇集合步骤。2CN114116771A权利要求书2/2页7.根据权利要求6所述的声控数据分析方法,其特征在于,所述提取所述语音信息的特征信息,并根据所述特征信息识别所述语音信息对应的身份之前,还包括:当接收到预设指令后,获取主讲人的语音信息;提取所述语音信息的特征信息,并将该特征信息作为标准特征信息。8.一种声控数据分析装置,其特征在于,包括:文本处理模块,用于将语音信息转换为文本信息,并对所述文本信息进行过滤,得到词汇集合;第一计算模