预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共11页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113627480A(43)申请公布日2021.11.09(21)申请号202110775729.6(22)申请日2021.07.09(71)申请人武汉大学地址430072湖北省武汉市武昌区珞珈山武汉大学(72)发明人聂雯杨杰赵伶俐史磊李平湘孙维东赵金奇(74)专利代理机构武汉科皓知识产权代理事务所(特殊普通合伙)42222代理人王琪(51)Int.Cl.G06K9/62(2006.01)G06N3/04(2006.01)G06N3/08(2006.01)权利要求书2页说明书6页附图2页(54)发明名称一种基于强化学习的极化SAR影像分类方法(57)摘要本发明涉及一种基于强化学习的极化SAR影像分类方法。首先对极化SAR影像进行辐射定标、滤波处理,接着对其进行极化分解得到极化特征参数,并对极化特征参数进行归一化处理,构建极化‑空间联合样本集,然后采用强化学习的开发‑利用学习机制训练FCN模型,在提升样本空间上下文信息和极化特征信息利用效率的同时,通过对样本的学习探索,生成大量的经验数据来训练模型,以达到减少样本量和提升分类精度的双重目的,最后用训练好的FCN模型对极化SAR影像进行分类。与现有需要大量数据驱动的CNN网络模型不同,本发明经过强化学习的经验生成和利用,在不超过2%的标注样本需求下即可获取很高的分类精度,满足极化SAR影像在小样本下高精度分类需求。CN113627480ACN113627480A权利要求书1/2页1.一种基于强化学习的极化SAR影像分类方法,其特征在于,包括如下步骤:步骤1,构建样本数据集;步骤2,基于强化学习的FCN网络模型训练;步骤2.1,初始化模型参数;步骤2.2,构建Actor‑critic模型训练机制;步骤2.2.1,构建Actor模块,包括以下几个步骤:步骤2.2.1.1,以批次的形式随机输入样本集中选取的样本;步骤2.2.1.2,根据现有的模块参数θa,利用FCN网络计算该样本属于所有候选标签类别的Q值及概率Pπ(a|s),并输出预测结果,其中π为模型现行分类策略,对于Actor模块生成的预测结果,Actor‑critic模型可根据对比样本标签真值,返回奖励值r,若分类正确,r=1,反之r=‑1;步骤2.2.1.3,保存经验数据(s,a,q,r)至记忆池中,其中s为样本特征,a表示预测结果,q是当前模型参数计算下的Q(s,a)值,r是奖励值;步骤2.2.2,构建Critic模块,包括以下几个步骤:步骤2.2.2.1,从记忆池中抽取经验数据(s,a,q,r);步骤2.2.2.2,根据现有模块参数θc,利用FCN网络计算新的Q值Q(s,a;θc);步骤2.2.2.3,对比Q(s,a;θc)与经验数据中的q值的差异,计算损失值并更新Critic模块参数θc、Actor模块参数θa;步骤2.3,采用Actor‑critic机制训练FCN模型;步骤3,利用训练好的FCN模型进行极化SAR影像分类。2.如权利要求1所述的一种基于强化学习的极化SAR影像分类方法,其特征在于:所述步骤1构建样本数据集包括以下几个子步骤:步骤1.1,提取极化特征参数;步骤1.2,归一化极化特征参数;步骤1.3,构建极化‑空间联合样本集。3.如权利要求2所述的一种基于强化学习的极化SAR影像分类方法,其特征在于:所述步骤步骤1.1中提取极化特征参数是先将获取的极化SAR影像进行辐射定标、滤波以提升影像质量,然后对预处理后的极化SAR影像进行极化分解得到极化特征参数信息。4.如权利要求2所述的一种基于强化学习的极化SAR影像分类方法,其特征在于:所述步骤1.2中归一化极化特征参数是先对极化特征影像进行2%的线性拉伸,将数据分布区间归一化为0~1,然后对拉伸后的特征参数依次开方,增加不同地物的对比度。5.如权利要求2所述的一种基于强化学习的极化SAR影像分类方法,其特征在于:所述步骤1.3是采用3D卷积核直接提取每个样本像素的空间域特征和极化域特征,从三维尺度上构建样本的极化‑空间特征表达空间,在保持样本空间邻域空间信息的基础上,充分利用极化SAR丰富的极化特征信息,提高特征利用率。6.如权利要求1所述的一种基于强化学习的极化SAR影像分类方法,其特征在于:所述步骤2.1中初始化模型参数包括初始化经验记忆池D,容量大小设置为M=256;初始化Critic模块参数θc、Actor模块参数θa为随机值,设置Actor模块更新频率τ=126;设置总训练轮次K=300,设置每轮次迭代次数T=256;设置样本批次输入数量N=128;设置贪心学习2CN113627480A权利要求书2/2页测量学习率ε=1.0。7.如权利要求1所述的一种基于强化学习的极化SAR