预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共19页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局*CN103440348A*(12)发明专利申请(10)申请公布号(10)申请公布号CNCN103440348103440348A(43)申请公布日2013.12.11(21)申请号201310420161.1(22)申请日2013.09.16(71)申请人重庆邮电大学地址400065重庆市南岸区黄桷垭崇文路2号(72)发明人陈善学于佳佳李俊韩勇冯银波(74)专利代理机构重庆市恒信知识产权代理有限公司50102代理人刘小红(51)Int.Cl.G06F17/30(2006.01)G06T7/40(2006.01)权权利要求书1页利要求书1页说明书12页说明书12页附图5页附图5页(54)发明名称一种基于矢量量化的全局和局部颜色图像检索方法(57)摘要一种基于矢量量化的全局和局部颜色图像检索方法。本发明提出一种新的颜色图像检索方法,涉及图像处理技术领域。该方法将RGB颜色空间转换为HSV颜色空间,运用基于神经网络的竞争学习算法训练码书,对颜色空间进行更为精确的聚类划分;引入颜色转移矩阵描述颜色的空间分布情况;将索引直方图和主颜色转移矩阵两种颜色特征相结合进行相似性度量;运用形态学开闭运算处理图像,凸显目标轮廓,以提取出局部感兴趣区域,突出了重要区域,限制背景信息。本发明提出的颜色图像检索方法克服了全局颜色直方图法对颜色空间分布描述不够,不能有效限制背景信息的缺点。使颜色量化更为准确,匹配效果更好,是进一步提高检索效率的有效方法。CN103440348ACN10348ACN103440348A权利要求书1/1页1.一种基于矢量量化的全局和局部颜色图像检索方法,其特征在于,读取彩色图像数据,将其从RGB颜色空间转换到HSV颜色空间,选取相邻且互不重叠的4×4像素点作为训练矢量;对训练矢量平方和排序形成初始码书;选取图像库中的图像构成训练矢量集训练初始码书;通过统计各颜色出现的频率百分比及相邻像素块的颜色变化情况,形成颜色索引直方图和主颜色转移矩阵,将其作为检索特征;利用形态学图像处理,凸显目标轮廓以提取感兴趣局部图像区域;利用全局颜色特征和局部感兴趣区域颜色特征加权检索,获得感兴趣区域图像。2.根据权利要求1所述方法,其特征在于,所述计算初始码书设计包括:计算训练矢量集中每个训练矢量的平方和,并按升序排列;根据码书尺寸N将排序后的训练矢量分成N段,依次选择每段的第一个码字作为初始码字,形成尺寸为N的初始码书,采用CL算法训练初始码书,获取色调、饱和度和亮度形成最终码书,并输出包含N种颜色的查色表的码字的索引值。3.根据权利要求1所述方法,其特征在于,根据查色表统计图像中各码字索引出现的频率百分比,形成颜色索引直方图;根据矢量量化码字索引表,对图像进行Z字型扫描,统计相邻像素块的颜色变化情况,形成主颜色转移矩阵。4.根据权利要求1所述方法,其特征在于,所述感兴趣局部图像区域提取具体包括:利用开闭运算对图像进行平滑处理,保留图像重要的轮廓并去除噪声;设定阈值去除细小分块,取出最大块的起始行列值及宽度和高度形成矩形区域;利用行列像素数目模M去除余数,形成行列像素数均为M的整数倍的矩形感兴趣局部图像区域。5.根据权利要求1所述方法,其特征在于,利用全局和局部感兴趣区域颜色特征进行加权检索具体为:统计全局和局部各颜色的频率百分比,形成颜色索引直方图HA,HB,Ha,Hb;统计相邻像素块的颜色变化情况,形成主颜色转移矩阵DA,DB,Da,Db。采用欧氏距离根据公式:计算全局相似度Simi1,其中ω1为全局颜色索引直方图的权重,ω2为全局主颜色转移矩阵的权重(ω1,ω2∈[0,1],且ω1+ω2=1);根据公式:计算局部相似度Simi2,其中ω3为局部颜色索引直方图的权重,ω4为局部主颜色转移矩阵的权重(ω3,ω4∈[0,1]且ω3+ω4=1);合成相似度Similar=pSimi1+qSimi2,将Similar按升序排列,返回检索结果,其中p,q∈[0,1]p+q=1。2CN103440348A说明书1/12页一种基于矢量量化的全局和局部颜色图像检索方法技术领域[0001]本发明属于基于内容的图像检索领域,具体涉及一种基于矢量量化的全局和局部感兴趣区域相结合的颜色检索方法。背景技术[0002]随着计算机技术、多媒体技术和网络技术的发展,大量图像数据通过互联网广泛传播。然而,因缺乏有效的图像检索方法,使得对于庞大的图像数据库的利用一直处于极低的效率。对于图像数据的检索方法通常有三种:自由浏览、基于文本的图像检索(TextBasedImageRetrieval,TBIR)和基于内容的图像检索(ContentBasedImageRetrieval,CBIR)。自由浏览只适用于偶然情况,对于经常使用特殊多媒体信息的