主体识别方法、装置、及计算机可读存储介质.pdf
波峻****99
亲,该文档总共12页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
主体识别方法、装置、及计算机可读存储介质.pdf
一种主体识别方法、装置及计算机可读介质,获取待识别的图片;将所获取的待识别的图片输入到预先训练好的目标检测模型,检测出所述图片中的物体,及所述图片中每个物体的属性特征;所述每个物体的属性特征包括该物体的中心点位置、该物体的尺寸参数、及该物体的置信度;根据所检测出的所述图片中每个物体的属性特征,确定所述图片中作为目标主体的物体。本申请能够灵活的识别图片中的目标主体。
行为识别方法、装置及计算机可读存储介质.pdf
本方案涉及人工智能,提供一种行为识别方法、装置及存储介质,方法包括:将视频流分割为图像帧序列;检测每一帧图像中的人体轮廓,并用第一矩形框将每个人体标记出来;计算每一帧图像中任两个第一矩形框之间的距离;若某一帧图像中两个第一矩形框之间的距离小于阈值,采用二人组合框将两个第一矩形框包围;查找前后多帧图像,将与二人组合框中相同的两个人都形成二人组合框,并将该帧图像及前后多帧图像中的二人组合框组成二人组合框序列;将二人组合框序列输入到神经网络模型中进行行为识别。本发明避免多余的背景给神经网络模型造成大量的计算量,
语音识别方法、装置及计算机可读存储介质.pdf
本发明公开了一种语音识别方法,所述方法包括:侦听用户发出的语音信息;对所述语音信息进行去噪处理并根据预存的语音模型识别用户的语音指令;采集用户周围环境的背景音;根据预存的背景音模型对所述背景音进行识别,并根据识别结果确定用户所处位置;将所述语音指令和位置信息结合,形成最终识别结果并输出。本发明还同时公开了一种语音识别装置及计算机可读存储介质。本发明可提升智能终端设备的语音识别准确率。
重音识别方法、装置及计算机可读存储介质.pdf
本发明公开了一种重音识别方法、装置及计算机可读存储介质,属于信号处理技术领域。方法包括:从音频信号中提取第一预设频率范围内的信号,得到第一音频信号,第一预设频率范围为重音对应的频率范围;通过波形包络算法从第一音频信号中确定满足预设条件的多个目标采样点,并基于多个目标采样点对应的信号幅值确定波形包络信号;基于波形包络信号确定音频信号中的多个重音。本发明通过对音频信号进行整体过滤,得到主要包含有重音成分的第一音频信号,之后,智能设备可以通过对第一音频信号处理得到的波形包络信号识别音频信号中的多个重音,该多个重
身份识别方法、装置及计算机可读存储介质.pdf
本发明涉及人工智能技术,揭露了一种身份识别方法,包括:收集声纹样本集,建立声纹库;对所述声纹样本集进行预处理操作,得到文本相关声纹向量序列集和文本无关声纹向量序列集;将所述文本相关声纹向量序列集进行压缩处理,得到声纹码本集,基于在文本相关声纹识别场景中接收用户的声纹语音内容接收用户的声纹语音内容,根据所述声纹语音内容与声纹码本集的欧式距离识别出所述用户的身份;对所述文本无关声纹向量序列集提取梅尔频率倒谱系数,基于在文本无关声纹识别场景中接收用户的声纹语音内容,根据所述梅尔频率倒谱系数检测出所述用户的身份。