预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共16页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN115063895A(43)申请公布日2022.09.16(21)申请号202210655359.7(22)申请日2022.06.10(71)申请人深圳市智远联科技有限公司地址518000广东省深圳市龙岗区坂田街道岗头社区天安云谷产业园二期(02-08地块)11栋1005(72)发明人王晨光周帅杨国荣晏承彬(74)专利代理机构深圳市中科创为专利代理有限公司44384专利代理师尹益群(51)Int.Cl.G07B5/00(2006.01)G10L15/26(2006.01)G10L21/0208(2013.01)G06V40/16(2022.01)权利要求书2页说明书9页附图4页(54)发明名称一种基于语音识别的售票方法及售票系统(57)摘要本发明提出一种基于语音识别的售票方法及售票系统,通过摄像头检测拍摄画面内是否存在大小、朝向以及停留时间符合预设条件的人脸图像,所述人脸图像包含嘴形图像,通过麦克风获取用户输入的语音信号,根据所述嘴形图像的变化确定用户输入的语音信号的起点和终点,对所述语音信号执行去噪,从去噪后的语音信号中提取用户的声音数据,对所述声音数据执行语音识别得到所述声音数据对应的文字内容,根据所述文字内容生成并显示票据信息,解决了公共场合的环境噪音导致语音识别成功率低的问题。CN115063895ACN115063895A权利要求书1/2页1.一种基于语音识别的售票方法,其特征在于,包括:通过摄像头检测拍摄画面内是否存在大小、朝向以及停留时间符合预设条件的人脸图像,所述人脸图像包含嘴形图像;通过麦克风获取用户输入的语音信号;根据所述嘴形图像的变化确定用户输入的语音信号的起点和终点;对所述语音信号执行去噪;从去噪后的语音信号中提取用户的声音数据;对所述声音数据执行语音识别得到所述声音数据对应的文字内容;根据所述文字内容生成并显示票据信息。2.根据权利要求1所述的基于语音识别的售票方法,其特征在于,在通过麦克风获取用户输入的语音信号的步骤之前,还包括:通过所述麦克风持续监听环境声音信息;分析所述环境声音信息中是否存在周期性噪声以及与所述周期性噪音对应的回音噪声;若存在所述周期性噪声,提取所述周期性噪声的时间特征和频谱特征;若存在与所述周期性噪音对应的回音噪声,提取所述回音噪声的时间特征和频谱特征。3.根据权利要求2所述的基于语音识别的售票方法,其特征在于,对所述语音信号执行去噪的步骤具体包括:若存在所述周期性噪声,根据所述周期性噪声的时间特征和频谱特征生成所述周期性噪声对应的第一反相波形;若存在与所述周期性噪音对应的回音噪声,根据所述回音噪声的时间特征和频谱特征生成所述回音噪声对应的第二反相波形;将所述语音信号、所述第一反相波形和/或所述第二反相波形输入到反相降噪函数中以抵消所述周期性噪声和/或所述回音噪声。4.根据权利要求3所述的基于语音识别的售票方法,其特征在于,根据所述嘴形图像的变化确定用户输入的语音信号的起点和终点的步骤具体包括:从所述摄像头拍摄的具有人脸图像的每一帧画面图像中提取嘴形图像;将每一帧画面图像中的嘴形图像与在先间隔帧数为n的具有人脸图像的画面图像中的嘴形图像进行对比,其中n为大于或等于1的正整数;判断用户的嘴形是否从闭合状态改变为张开状态;以所述用户的嘴形第一次从闭合状态改变为张开状态的画面图像对应的时间点为所述语音信号的起点;判断用户的嘴形是否从张开状态改变为闭合状态且保持闭合状态的时间超过预设的第一阈值;以所述用户的嘴形最后一次的从张开状态改变为闭合状态的时间点为所述语音信号的终点。5.根据权利要求4所述的基于语音识别的售票方法,其特征在于,对所述语音信号执行去噪的步骤还包括:2CN115063895A权利要求书2/2页获取所述用户的嘴形每一次从闭合状态改变为张开状态以及从张开状态改变为闭合状态的时间点,以获取所述用户的嘴形为张开状态以及闭合状态对应的时间段;从所述语音信号中剔除在所述用户嘴形为闭合状态的时间段内短时能量超过预设的第二阈值的声音信号。6.根据权利要求1到5所述的基于语音识别的售票方法,其特征在于,从去噪后的语音信号中提取用户的声音数据的步骤具体包括:将去噪后的语音信号输入到削波函数中获取用户声音的准基音周期;将所述准基音周期与所述语音信号输入到声音波形拟合函数中拟合用户的声音波形;根据拟合结果从所述语音信号中提取用户的声音数据。7.根据权利要求6所述的基于语音识别的售票方法,其特征在于,所述准基音周期由基音周期值及其误差范围值组成。8.根据权利要求7所述的基于语音识别的售票方法,其特征在于,将去噪后的语音信号输入到削波函数中获取用户声音的准基音周期的步骤具体包括:确定所述用户的声音数据的声音波形中的最大峰值;取所述最