主体识别方法、装置、及计算机可读存储介质-豆柴文库

主体识别方法、装置、及计算机可读存储介质.pdf

2023-07-25

10金币

834KB

12页

波峻****99

实名认证

内容提供者

1/10

2/10

3/10

4/10

5/10

6/10

7/10

8/10

9/10

10/10

亲，该文档总共12页，到这已经超出免费预览范围，如果喜欢就直接下载吧～

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113705285A(43)申请公布日2021.11.26(21)申请号202010440237.7(22)申请日2020.05.22(71)申请人珠海金山办公软件有限公司地址519015广东省珠海市吉大景山路莲山巷8号金山软件大厦申请人武汉金山办公软件有限公司(72)发明人陆瑾熊龙飞(74)专利代理机构北京安信方达知识产权代理有限公司11262代理人戴仕琴栗若木(51)Int.Cl.G06K9/00(2006.01)G06K9/34(2006.01)G06K9/62(2006.01)权利要求书2页说明书6页附图3页(54)发明名称主体识别方法、装置、及计算机可读存储介质(57)摘要一种主体识别方法、装置及计算机可读介质，获取待识别的图片；将所获取的待识别的图片输入到预先训练好的目标检测模型，检测出所述图片中的物体，及所述图片中每个物体的属性特征；所述每个物体的属性特征包括该物体的中心点位置、该物体的尺寸参数、及该物体的置信度；根据所检测出的所述图片中每个物体的属性特征，确定所述图片中作为目标主体的物体。本申请能够灵活的识别图片中的目标主体。CN113705285ACN113705285A权利要求书1/2页1.一种主体识别方法，包括：获取待识别的图片；将所获取的待识别的图片输入到预先训练好的目标检测模型，检测出所述图片中的物体，及所述图片中每个物体的属性特征；所述每个物体的属性特征包括该物体的中心点位置、该物体的尺寸参数、及该物体的置信度；根据所检测出的所述图片中每个物体的属性特征，确定所述图片中作为目标主体的物体。2.根据权利要求1所述的主体识别方法，其特征在于，所述根据所检测出的所述图片中每个物体的属性特征，确定所述图片中作为目标主体的物体，包括：根据所检测出的所述图片中每个物体的属性特征，以及物体的每个属性特征各自对应的预设权重，确定所述图片中作为目标主体的物体。3.根据权利要求2所述的主体识别方法，其特征在于，所述根据所检测出的所述图片中每个物体的属性特征，以及物体的每个属性特征各自对应的预设权重，确定所述图片中作为目标主体的物体包括：根据每个物体的尺寸参数分别确定该物体在所述图片中的面积占比，根据每个物体的中心点位置分别确定该物体的中心点与所述图片的中心点的距离；根据每个物体的面积占比和预设的尺寸参数的权重、每个物体的中心点与图片的中心点的距离和预设的中心点位置的权重、以及置信度和置信度的权重，确定所述图片中作为目标主体的物体。4.根据权利要求3所述的主体识别方法，其特征在于，所述根据每个物体的面积占比和预设的尺寸参数的权重、每个物体的中心点与图片的中心点的距离和预设的中心点位置的权重、以及置信度和置信度的权重，确定所述图片中作为目标主体的物体，包括：根据每个物体的面积占比和预设的尺寸参数的权重、每个物体的中心点与图片的中心点的距离和预设的中心点位置的权重、以及置信度和置信度的权重，确定每个物体作为目标主体的物体的得分；将得分值大于预定阈值的物体确定为目标主体。5.根据权利要求4所述的主体识别方法，其特征在于，所述根据每个物体的面积占比和预设的尺寸参数的权重、每个物体的中心点与图片的中心点的距离和预设的中心点位置的权重、以及置信度和置信度的权重，确定每个物体作为目标主体的物体的得分，包括：对于所述图片中的每个物体分别进行如下操作：将该物体的面积占比和预设的尺寸参数的权重、中心点与图片的中心点的距离和预设的中心点位置的权重、以及置信度和置信度的权重对应相乘并求和；根据求和结果得到该物体作为目标主体的得分值。6.根据权利要求1所述的主体识别方法，其特征在于，所述确定所述图片中作为目标主体的物体后还包括：将所确定的作为目标主体的物体从所述图片中单独截取。7.根据权利要求1所述的主体识别方法，其特征在于，所述预先训练好的目标检测模型为FasterRCNN、MaskRCNN、SSD、或者YOLOv3等模型。8.一种主体识别装置，其特征在于，包括：2CN113705285A权利要求书2/2页获取模块，用于获取待识别的图片；检测模块，用于将所获取的待识别的图片输入到预先训练好的目标检测模型，检测出所述图片中的物体，及所述图片中每个物体的属性特征；所述每个物体的属性特征包括该物体的中心点位置、该物体的尺寸参数、及该物体的置信度；确定模块，用于根据所检测出的所述图片中每个物体的属性特征，确定所述图片中作为目标主体的物体。9.一种主体识别装置，包括处理器和存储器，其特征在于，所述存储器中存储有用于进行主体识别的程序；所述处理器用于读取所述用于主体识别的程序，执行权利要求1-8中任一项所述的方法。10.一种计算机可读介质，用于存储用于进行主体识别的程序，所述程序

相关资料

主体识别方法、装置、及计算机可读存储介质.pdf

一种主体识别方法、装置及计算机可读介质，获取待识别的图片；将所获取的待识别的图片输入到预先训练好的目标检测模型，检测出所述图片中的物体，及所述图片中每个物体的属性特征；所述每个物体的属性特征包括该物体的中心点位置、该物体的尺寸参数、及该物体的置信度；根据所检测出的所述图片中每个物体的属性特征，确定所述图片中作为目标主体的物体。本申请能够灵活的识别图片中的目标主体。

2023-07-25

834KB

行为识别方法、装置及计算机可读存储介质.pdf

本方案涉及人工智能，提供一种行为识别方法、装置及存储介质，方法包括：将视频流分割为图像帧序列；检测每一帧图像中的人体轮廓，并用第一矩形框将每个人体标记出来；计算每一帧图像中任两个第一矩形框之间的距离；若某一帧图像中两个第一矩形框之间的距离小于阈值，采用二人组合框将两个第一矩形框包围；查找前后多帧图像，将与二人组合框中相同的两个人都形成二人组合框，并将该帧图像及前后多帧图像中的二人组合框组成二人组合框序列；将二人组合框序列输入到神经网络模型中进行行为识别。本发明避免多余的背景给神经网络模型造成大量的计算量，

2023-08-27

610KB

语音识别方法、装置及计算机可读存储介质.pdf

本发明公开了一种语音识别方法，所述方法包括：侦听用户发出的语音信息；对所述语音信息进行去噪处理并根据预存的语音模型识别用户的语音指令；采集用户周围环境的背景音；根据预存的背景音模型对所述背景音进行识别，并根据识别结果确定用户所处位置；将所述语音指令和位置信息结合，形成最终识别结果并输出。本发明还同时公开了一种语音识别装置及计算机可读存储介质。本发明可提升智能终端设备的语音识别准确率。

2024-01-10

580KB

重音识别方法、装置及计算机可读存储介质.pdf

本发明公开了一种重音识别方法、装置及计算机可读存储介质，属于信号处理技术领域。方法包括：从音频信号中提取第一预设频率范围内的信号，得到第一音频信号，第一预设频率范围为重音对应的频率范围；通过波形包络算法从第一音频信号中确定满足预设条件的多个目标采样点，并基于多个目标采样点对应的信号幅值确定波形包络信号；基于波形包络信号确定音频信号中的多个重音。本发明通过对音频信号进行整体过滤，得到主要包含有重音成分的第一音频信号，之后，智能设备可以通过对第一音频信号处理得到的波形包络信号识别音频信号中的多个重音，该多个重

2023-12-05

788KB

身份识别方法、装置及计算机可读存储介质.pdf

本发明涉及人工智能技术，揭露了一种身份识别方法，包括：收集声纹样本集，建立声纹库；对所述声纹样本集进行预处理操作，得到文本相关声纹向量序列集和文本无关声纹向量序列集；将所述文本相关声纹向量序列集进行压缩处理，得到声纹码本集，基于在文本相关声纹识别场景中接收用户的声纹语音内容接收用户的声纹语音内容，根据所述声纹语音内容与声纹码本集的欧式距离识别出所述用户的身份；对所述文本无关声纹向量序列集提取梅尔频率倒谱系数，基于在文本无关声纹识别场景中接收用户的声纹语音内容，根据所述梅尔频率倒谱系数检测出所述用户的身份。

2023-06-25

658KB