预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共31页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113822282A(43)申请公布日2021.12.21(21)申请号202110662643.2(22)申请日2021.06.15(71)申请人腾讯科技(深圳)有限公司地址518057广东省深圳市南山区高新区科技中一路腾讯大厦35层(72)发明人何楠君卢东焕李悦翔马锴郑冶枫(74)专利代理机构北京三高永信知识产权代理有限责任公司11138代理人张所明(51)Int.Cl.G06K9/34(2006.01)G06K9/62(2006.01)G06N20/00(2019.01)权利要求书3页说明书20页附图7页(54)发明名称图像语义分割方法、装置、计算机设备及存储介质(57)摘要本申请关于一种图像语义分割方法、装置、计算机设备及存储介质,涉及图像处理技术领域。所述方法包括:获取目标图像;获取目标图像对应在查询维度上的第一向量矩阵,键维度上的第二向量矩阵以及值维度上的第三向量矩阵;对目标向量矩阵中的数值进行n次位置交换,获得n个扩展向量矩阵;基于第一向量矩阵、第二向量矩阵、以及n个扩展向量矩阵,获取自注意力向量矩阵;基于自注意力向量矩阵以及第三向量矩阵获取输出向量矩阵;基于输出向量矩阵,获取目标图像对应的语义分割结果。通过上述方法,使得在获取目标图像的语义分割结果的过程中,能够利用扩展向量矩阵充分挖掘K与Q之间不同特征维度包含的空间信息,进而提高了图像语义分割的精度。CN113822282ACN113822282A权利要求书1/3页1.一种图像语义分割方法,其特征在于,所述方法包括:获取目标图像;获取所述目标图像对应在查询维度上的第一向量矩阵,键维度上的第二向量矩阵以及值维度上的第三向量矩阵;对目标向量矩阵中的数值进行n次位置交换,获得n次位置交换分别对应的扩展向量矩阵;所述目标向量矩阵是所述第一向量矩阵以及所述第二向量矩阵中的至少一个;n为正整数;基于所述第一向量矩阵、所述第二向量矩阵、以及n次位置交换分别对应的所述扩展向量矩阵,获取所述目标图像的自注意力向量矩阵;基于所述自注意力向量矩阵以及所述第三向量矩阵获取输出向量矩阵;基于所述输出向量矩阵,获取所述目标图像对应的语义分割结果。2.根据权利要求1所述的方法,其特征在于,所述第一向量矩阵、所述第二向量矩阵以及所述第三向量矩阵分别包含所述目标图像中各个图像块的特征向量;所述对目标向量矩阵中的数值进行n次位置交换,获得n次位置交换分别对应的扩展向量矩阵,包括:以所述特征向量为单位,对所述目标向量矩阵中的数值进行n次位置交换,获得n次位置交换分别对应的所述扩展向量矩阵。3.根据权利要求2所述的方法,其特征在于,所述以所述特征向量为单位,对所述目标向量矩阵中的数值进行n次位置交换,获得n次位置交换分别对应的所述扩展向量矩阵,包括:以所述特征向量为单位,按照指定步长对所述目标向量矩阵中的数值进行n次循环位置交换,获得n次循环位置交换分别对应的所述扩展向量矩阵。4.根据权利要求3所述的方法,其特征在于,所述以所述特征向量为单位,按照指定步长对所述目标向量矩阵中的数值进行n次循环位置交换,获得n次循环位置交换分别对应的所述扩展向量矩阵,包括:获取组成所述目标向量矩阵的特征向量队列;响应于一次循环位置交换,将处于所述特征向量队列末端的所述指定步长位数的特征向量,移动至所述特征向量队列的首位,并顺次移动所述特征向量队列中的其他特征向量。5.根据权利要求4所述的方法,其特征在于,所述方法还包括:响应于循环位置交换的次数达到次数阈值,停止循环位置交换;所述次数阈值是基于所述目标向量矩阵中所述特征向量的数量以及所述指定步长确定的。6.根据权利要求2所述的方法,其特征在于,所述以所述特征向量为单位,对所述目标向量矩阵中的数值进行n次位置交换,获得n次位置交换分别对应的所述扩展向量矩阵,包括:以所述特征向量为单位,随机对所述目标向量矩阵中的数值进行n次位置交换,获得n次位置交换分别对应的所述扩展向量矩阵。7.根据权利要求1所述的方法,其特征在于,响应于所述目标向量矩阵为所述第二向量矩阵,所述基于所述第一向量矩阵、所述第二向量矩阵、以及n次位置交换分别对应的所述扩展向量矩阵,获取所述目标图像的自注意力向量矩阵,包括:2CN113822282A权利要求书2/3页获取所述第一向量矩阵与n次位置交换分别对应的所述扩展向量矩阵的n个点乘结果;获取所述n个点乘结果的平均值;基于所述平均值,获取所述目标图像的自注意力向量矩阵。8.根据权利要求1所述的方法,其特征在于,在获取所述目标图像对应在查询维度上的第一向量矩阵,键维度上的第二向量矩阵以及值维度上的第三向量矩阵之前,所述方法还包括:对所述目标图像进行序列化处理,获取所述目标图像对应的