预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共16页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN110516026A(43)申请公布日2019.11.29(21)申请号201910635330.0(22)申请日2019.07.15(71)申请人西安电子科技大学地址710071陕西省西安市雁塔区太白南路2号(72)发明人王笛王泉万波安亚强田玉敏杨鹏飞赵辉(74)专利代理机构陕西电子工业专利中心61205代理人田文英王品华(51)Int.Cl.G06F16/31(2019.01)G06F16/51(2019.01)G06F16/953(2019.01)G06K9/62(2006.01)权利要求书3页说明书10页附图2页(54)发明名称基于图正则化非负矩阵分解的在线单模态哈希检索方法(57)摘要本发明公开了一种基于图正则化非负矩阵分解的在线哈希信息检索方法,其步骤为:(1)生成初始训练集;(2)在线有监督训练单模态哈希检索模型;(3)利用图正则化非负矩阵分解构造信息损失函数;(4)获得最优投影矩阵和哈希编码;(5)生成待检索的图像或文本样本的哈希编码;(6)获取检索结果。本发明采用图正则化非负矩阵分解的思想构建信息损失函数,能够对实时获取的有标签数据在线建立模型,并根据获取到的数据在线更新模型,在模型训练的过程中,信息检索系统只需存储前一轮的优化结果,降低了系统存储压力,提高了计算速度,具有广泛的适应性。CN110516026ACN110516026A权利要求书1/3页1.一种基于图正则化非负矩阵分解的在线单模态哈希检索方法,其特征在于,在线实时获取有标签图像或文本数据,利用图正则化非负矩阵分解构造信息损失函数,在线有监督训练单模态哈希检索模型,该方法的具体步骤包括如下:(1)生成初始训练集:(1a)采集不少于50个图像样本或文本样本组成初始训练集,每个图像样本包含图像和其标签,每个文本样本包含文本和其标签;(1b)利用样本转化方法,将初始训练集中的每个图像样本或文本样本转化成图像或文本信息矩阵;(1c)利用归一化公式,将图像或文本信息矩阵中的所有元素进行归一化处理,得到归一化后的图像或文本信息矩阵;(1d)将归一化后的图像或文本信息矩阵存入到信息检索系统中;(2)在线有监督训练单模态哈希检索模型:(2a)信息检索系统在线实时获取不少于50个带标签的图像或文本样本,组成数据集,依次利用样本转化方法和归一化公式,对每个带标签的图像或文本样本进行预处理,得到归一化后的图像或文本信息矩阵;(2b)在信息检索系统中创建一个大小为50的缓冲区;(2c)从数据集中任选一个未选过的图像或文本样本加入到缓冲区中;(2d)判断缓冲区中的图像或文本样本的总数是否大于50,若是,则删除缓冲区中的第一个图像或文本样本后执行步骤(2e),否则,执行步骤(2c);(2e)按照下式,确定由图像或文本样本的标签信息构造的相似度矩阵中的每个元素值:其中,wpq表示相似度矩阵中第p行第q列的元素值,xs表示归一化后的图像或文本信息矩阵中的第s个样本,xf表示归一化后的图像或文本信息矩阵中的第f个样本,p和s的取值相等,q和f的取值相等;(3)利用图正则化非负矩阵分解构造信息损失函数:(3a)按照下式,将标签信息添加到非负矩阵分解的分解过程中,计算图正则化损失值:TF1=Tr(VLV)其中,F1表示图正则化损失值,Tr表示矩阵迹操作,V表示分解矩阵,L表示由相似度矩阵减去相似度矩阵的对角矩阵得到的对角相似度矩阵,T表示对矩阵做转置操作;(3b)按照下式,将图正则化添加到非负矩阵分解的分解过程中,构造基于图正则化非负矩阵分解损失函数:其中,F2表示基于图正则化非负矩阵分解损失函数,||||F表示F范数操作,X表示归一化后的图像或文本信息矩阵,U表示基矩阵,V表示分解矩阵,λ表示偏置参数,λ的取值为10,Tr表示矩阵迹操作,L表示由相似度矩阵减去相似度矩阵的对角矩阵得到的对角相似度矩阵,T表示对矩阵做转置操作;2CN110516026A权利要求书2/3页(3c)随机生成三个矩阵其中,U表示潜在语义矩阵,∈表示属于符号,R表示实数集,d1和d2分别表示取值为图像或文本信息矩阵的列数的潜在语义矩阵和投影矩阵的行数,d1和d2的取值对应相等,k1、k2和k3表示取值相等的哈希编码长度,其数值由用户从8bit,16bit,24bit,32bit,64bit,128bit的编码长度中随机选取的一个值,P表示投影矩阵,V表示哈希编码矩阵,T表示转置操作,d3表示取值为50的哈希编码矩阵的行数;(3d)按照下式,构造包含潜在语义矩阵、哈希编码矩阵和投影矩阵的信息损失函数:其中,F表示包含潜在语义矩阵、哈希编码矩阵和投影矩阵的信息损失函数,||||F表示F范数操作,X表示归一化后的信息矩阵,L表示对角相似度