预览加载中,请您耐心等待几秒...
1/7
2/7
3/7
4/7
5/7
6/7
7/7

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN110609914A(43)申请公布日2019.12.24(21)申请号201910722255.1(22)申请日2019.08.06(71)申请人厦门大学地址361005福建省厦门市思明南路422号(72)发明人纪荣嵘林明宝(74)专利代理机构厦门南强之路专利事务所(普通合伙)35200代理人马应森(51)Int.Cl.G06F16/532(2019.01)权利要求书1页说明书4页附图1页(54)发明名称一种基于快速类别更新的在线哈希学习图像检索方法(57)摘要一种基于快速类别更新的在线哈希学习图像检索方法,涉及图像检索。针对传统的要求训练集一次性获得的哈希技术存在训练效率低下、存储空间消耗大的缺点,考虑在线学习的方案代替线下参数学习,构建基于类别相似性保留的汉明空间学习方法,提供一种基于图像数据流的哈希图像检索学习方案。包括以下步骤:1)不考虑用整体的训练集训练哈希模型,每次模型迭代中,仅使用一小块数据流;2)构建基于内积的相似性保留损失函数;3)使用基于类别的迭代更新;4)使用半量化方式的优化方案。CN110609914ACN110609914A权利要求书1/1页1.一种基于相似性分布学习的监督式在线哈希图像检索方法,其特征在于包括以下步骤:1)不考虑用整体的训练集训练哈希模型,每次模型迭代中,仅使用一小块数据流;2)构建基于内积的相似性保留损失函数;3)基于类别的迭代;4)使用半量化方式的优化方案。2CN110609914A说明书1/4页一种基于快速类别更新的在线哈希学习图像检索方法技术领域[0001]本发明涉及图像检索,具体是涉及一种基于快速类别更新的在线哈希学习图像检索方法。背景技术[0002]随着近年来互联网、云计算、物联网、社交媒体以及其他信息技术的迅速发展,各行各业累计的数据都呈现出爆炸式增长趋势,目前数据在现有容量与增长速度上已经远远超过当前技术的处理能力。最近邻搜索(NearestNeighborSearch)也称作最近点搜索,是指在一个尺度空间中搜索与查询点最近点的优化问题。具体定义如下:在尺度空间M中给定一个数据库点集S和一个查询点q∈M,在S中找到距离q最近的点。其中M为多维的欧几里得空间,距离由欧几里得距离决定。最近邻搜索在很多领域中都有很广泛应用,如:计算机视觉、信息检索、数据挖掘、机器学习,大规模学习等。其中在计算机视觉领域中应用最广,如:计算机图形学、图像检索、复本检索、物体识别、场景识别、场景分类、姿势估计、特征匹配等。[0003]最近邻搜索有两个关键问题:1、特征维度较高;2、数据量较大。因此,简单的穷尽搜索面临非常高的时间复杂度的问题,将原始数据从存储中加载到内存也成为了现实应用中所必须解决的一个瓶颈。近年来来,在实际应用中出现了一些时间复杂度为次线性的快速有效的最近邻搜索方法,例如:KD树、Ball树、Metric树、vantage-point树等。然而,基于树的索引方法本身存在着一个不能忽视的问题,这些方法需要的存储空间太大,在某些时候存储这些索引树的空间甚至超过存储数据本身所需的存储空间。同时随着数据的维度增加时,会对数据检索时间造成很明显的影响,其检索时间会急剧增加。与基于树的索引将数据空间进行递归的划分不同,哈希类算法(又可以称作二值编码)重复的对整个数据空间进行二类划分,同时对于每一个划分进行一次二值编码。即哈希算法将输入数据映射到一个离散的汉明空间,每一个数据点用一串二值码表示。在大多数情况下哈希算法不使用编码后得到的二值码进行穷尽检索,而是将其组织成哈希表的形式每一个哈希码在表中对应其中一个项目,如图1所示。汉明距离可以通过异或操作进行快速计算,因此使用哈希码对数据库进行穷尽检索,时间复杂度也能满足应用要求。[0004]目前,具有代表性的哈希方法有:半监督哈希,监督哈希,无监督哈希,以及深度学习结合的哈希。然而,这些基于学习的哈希方法,从利用监督信息来区分可以分为监督学习哈希方法,无监督学习哈希方法。由于获取监督信息成本较高,在超大规模数据的情况下只有很少部分数据带有监督信息,因此目前主流的研究热点为无监督学习哈希方法与半监督学习方法。虽然与深度学习相结合的哈希在检索性能上表现优异,但是在训练时需要监督信息。本文主要研究无监督学习哈希方法,并通过利用利用数据数据之间的局部线性关系而获得更好的哈希表示,而不是像距离尺度学习一样假设原始数据在空间存在一个统一的语义距离能够很好的表示数据与数据之间语义距离,而数据局部的之间的关系即数据的最近邻更能体现数据语义相似性。诱导流型哈希(InductiveHashingOnManifolds)(参考3CN110609914A说明书2/4页文献Shen,Fum