预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共14页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN114581769A(43)申请公布日2022.06.03(21)申请号202210063160.5G06V10/82(2022.01)(22)申请日2022.01.19G06K9/62(2022.01)G06N3/04(2006.01)(71)申请人西南交通大学G06N3/08(2006.01)地址611756四川省成都市高新区西部园区西南交通大学申请人农业农村部大数据发展中心(72)发明人胡华浪韩旭黄进李剑波申克建(74)专利代理机构成都弘毅天承知识产权代理有限公司51230专利代理师岳子强(51)Int.Cl.G06V20/10(2022.01)G06V10/44(2022.01)G06V10/764(2022.01)权利要求书3页说明书7页附图3页(54)发明名称一种基于无监督聚类的在建房屋识别方法(57)摘要本发明公开了一种基于无监督聚类的在建房屋识别方法,涉及计算机视觉技术领域,包括以下步骤:通过图像采集装置采集在建房屋的图像数据;对收集到图像数据中的在建房屋的位置进行人工标注,然后将标注后的在建房屋进行裁剪,得到在建房屋图像数据集;设置好聚类的类别数目,然后将在建房屋图像数据采用对比聚类的无监督方式进行类别划分;各个在建房屋在通过聚类后都有相应的类别,将该在建房屋数据的类别标注到原始图像上的标签;对于标注上标签的在建房屋数图像据集,采用Yolox目标检测算法进行模型训练;根据房屋数据的每个类别在测试集的预测效果,调整每个类别的置信度阈值;更有利于模型的训练和收敛,保持高召回率,提高检测精度。CN114581769ACN114581769A权利要求书1/3页1.一种基于无监督聚类的在建房屋识别方法,其特征在于,包括以下步骤:S1、制作数据集:通过图像采集装置采集在建房屋的图像数据;S2、数据集预处理:对收集到图像数据中的在建房屋的位置进行人工标注,然后将标注后的在建房屋进行裁剪,得到在建房屋图像数据集;S3、数据无监督聚类:设置好聚类的类别数目,然后将S2步骤得到的在建房屋图像数据采用对比聚类的无监督方式进行类别划分;S4、标签重定义:各个在建房屋在通过聚类后都有相应的类别,将该在建房屋数据的类别标注到原始图像上的标签;S5、检测模型训练:对于标注上标签的在建房屋数图像据集,采用Yolox目标检测算法进行模型训练;S6、模型置信度阈值设定:根据房屋数据的每个类别在测试集的预测效果,调整每个类别的置信度阈值。2.根据权利要求1所述的一种基于无监督聚类的在建房屋识别方法,其特征在于,所述步骤S1中通过图像采集装置采集在建房屋的各个时期、各个角度、不同焦距的图像数据。3.根据权利要求1所述的一种基于无监督聚类的在建房屋识别方法,其特征在于,所述步骤S2中使用LabelImage工具对图像中的在建房屋的位置进行人工标注。4.根据权利要求1所述的一种基于无监督聚类的在建房屋识别方法,其特征在于,所述步骤S3中在建房屋图像数据采用对比聚类的无监督方式进行类别划分包括以下步骤:ab在建房屋图像数据样本xi,使用两种数据增强方式T和T,增强后的图像和为:对增强后的图像采用Resnet34作为特征提取网络,提取特征向量表示为:其中和代表特征向量,f(·)表示特征提取网络;特征向量和再经过两层非线性感知器(MLP)进行映射为:其中和表示映射后的特征向量,g(·)表示非线性感知器;定义样本的损失为:2CN114581769A权利要求书2/3页其中τI是实例层次的temperature参数,s(·)代表余弦相似度运算,N表示设定的batch大小,因此经过数据增强过后,batch内共有2N个数据,对于每一个样本都可以形成1个正样本对和2N‑2个负样本对,和分别表示一个batch中第j个样本经过Ta和Tb数据增强后所提取的特征向量;样本在实例层次总损失lins如下式所示:当数据样本被映射到与聚类cluster数量相同的空间维度时,数据特征的每一维可以看作是该样本属于该类别的概率,通过特征提取网络提取的特征向量经过两层非线性感知器将其映射成M,M表示聚类类别数维向量,即:其中gc(·)为非线性感知器,和分别表示经过感知器映射过后的M维向量,则一个batch内的样本在Ta和Tb数据增强下组成Ya∈RN×M,Yb∈RN×M矩阵;定义为Ya中第i列,同理,为Yb第i列,因此样本与在集群层次的损失定义为:a其中τC是集群层次的temperture参数,M表示聚类类别数,为样本在T数据增强下第j个类别的聚类分配,同理,表示样本在Tb数据增强下第j个类别的聚类分配;样本在集群层次总损失lclu为下式所示:H(Y)为聚类分配概率的信息熵,是为了避免网络将所有实例都分配到一个聚类簇中,具体表示如下