预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共69页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN107369448A(43)申请公布日2017.11.21(21)申请号201710142423.0G10L25/63(2013.01)(22)申请日2017.03.10A63F7/00(2006.01)A63F7/22(2006.01)(30)优先权数据A63F7/36(2006.01)62/335,7662016.05.13US15/276,6952016.09.26US(71)申请人环球娱乐株式会社地址日本东京申请人阿鲁策游戏香港有限公司(72)发明人佐藤纯平长﨑良博上甲哲士(74)专利代理机构北京律盟知识产权代理有限责任公司11287代理人林斯凯(51)Int.Cl.G10L15/25(2013.01)G10L15/22(2006.01)权利要求书1页说明书25页附图42页(54)发明名称语音识别装置及游戏机(57)摘要本发明涉及一种语音识别装置及游戏机。语音识别装置(5)具有:摄像机机构(511、512),对多个人物拍摄包含各人物的嘴部的动态图像;麦克风机构(513),取得各人物说话的声音;及主单元(101),基于麦克风机构(513)取得声音时由摄像机机构(511、512)拍摄到的各人物的嘴部活动,从所述多个人物中特定出说话的人物。CN107369448ACN107369448A权利要求书1/1页1.一种语音识别装置,其特征在于包括:摄像机机构,对多个人物拍摄包含各人物的嘴部的动态图像;麦克风机构,取得所述各人物说话的声音;及语音识别控制装置,基于所述麦克风机构取得声音时由所述摄像机机构拍摄到的各人物的嘴部活动,从所述多个人物中特定出说话的人物。2.根据权利要求1所述的语音识别装置,其特征在于:所述摄像机机构具有多个摄像机装置,以便个别地拍摄所述各人物,所述麦克风机构具有多个麦克风装置,以便个别地取得所述各人物说话的声音。3.根据权利要求1所述的语音识别装置,其特征在于:包括动态图像存储装置,所述动态图像存储装置存储由所述摄像机机构拍摄到的所述动态图像、和所述动态图像的拍摄时间,所述语音识别控制装置从所述动态图像存储装置中,读出包含取得所述声音时的拍摄时间的动态图像,利用所述拍摄时间的动态图像,特定出说话的人物。4.一种游戏机,其特征在于包括根据权利要求1所述的语音识别装置。5.一种游戏机,其特征在于包括:根据权利要求1所述的语音识别装置;及发牌员替代装置,进行游戏中使用的游戏用具的操作动作、和面向所述人物即玩家的演出动作。6.根据权利要求5所述的游戏机,其特征在于:包括控制装置,所述控制装置以如下方式进行控制,即,使所述发牌员替代装置执行与所述语音识别控制装置特定出的玩家的说话内容对应的动作。7.一种游戏机,其特征在于包括:发牌员替代装置,具有臂部及躯体,所述臂部能够使操作游戏中使用的游戏用具的操作部移动而定位于三维空间的任意位置,所述躯体支撑所述臂部,且向玩家执行演出动作;多个游戏台,供玩家执行游戏;多个摄像机机构,取得并记录该游戏台的玩家的影像;多个麦克风机构,取得该游戏台的玩家的声音;及控制装置,当利用所述游戏台中的一个麦克风机构说话时,根据记录于所述多个摄像机的动态图像,分析说话时间点的各玩家的表情,特定出说话的玩家,并由所述发牌员替代装置执行与所述说话内容对应的动作。2CN107369448A说明书1/25页语音识别装置及游戏机[0001]本申请案主张2016年05月13日申请的临时专利申请案第62/335,766号的优先权,所述临时专利申请案的揭示内容以全文引用的方式并入本文中。技术领域[0002]本发明涉及一种自动识别人的说话内容的语音识别装置及游戏机。背景技术[0003]一直以来,声音识别装置的开发不断在进行,当人说话时,所述声音识别装置自动识别说话内容,输出到显示装置或以说话信息的形式加以输出(日本专利特开2016-99469号公报等)。[0004]然而,所述现有构成是以一个人说话为前提而形成的,因而在多人混在一起说话的状态下便无法识别。因此,期望即便在有旁人混在一起说话的场所,也能特定出说话人物,由声音识别装置进行识别处理。[0005]因此,本发明的目的在于提供一种能够以高可靠性特定出说话人物的语音识别装置及游戏机。发明内容[0006]本发明是一种语音识别装置,具有:摄像机机构,对多个人物拍摄包含各人物的嘴部的动态图像;麦克风机构,取得所述各人物说话的声音;及语音识别控制装置,基于所述麦克风机构取得声音时由所述摄像机机构拍摄到的各人物的嘴部活动,从所述多个人物中特定出说话的人物。[0007]根据所述构成,基于麦克风机构取得的声音、和摄像机机构取得的各人物的嘴部活动,特定出说话的人物,由此,即便在相邻人物距离近,仅凭声音