预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共39页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN109271102A(43)申请公布日2019.01.25(21)申请号201811006476.0(22)申请日2018.08.30(71)申请人杜广香地址252659山东省聊城市临清市代湾镇代南村卫生室(72)发明人不公告发明人(51)Int.Cl.G06F3/06(2006.01)权利要求书6页说明书29页附图3页(54)发明名称识别大数据存储系统中的低访问度存储设备的方法及系统(57)摘要本发明公开了一种用于识别大数据存储系统中的低访问度存储设备的方法及系统,其中方法包括:在确定所述大数据存储系统内的所有存储设备中均没有正在运行的数据访问操作时,确定每个存储设备的访问信息统计文件;基于低频项数量、每个低频数据项的存储尺寸、每个存储设备的总存储容量、每个存储设备的空闲存储容量、具有最大存储尺寸的低频存储项和具有最小存储尺寸的低频存储项计算每个存储设备的低频访问度:将多个存储设备中低频访问度大于访问度阈值的存储设备确定为低访问度存储设备。CN109271102ACN109271102A权利要求书1/6页1.一种用于识别大数据存储系统中的低访问度存储设备的方法,所述方法包括:响应于接收到在大数据存储系统内的多个存储设备中识别低访问度存储设备的识别请求,将所述大数据存储系统从任意的数据请求方所接收的新的数据访问请求重定向到所述大数据存储系统的系统缓冲设备而不将所接收的新的数据访问请求发送给多个存储设备中的相应的存储设备,以由所述系统缓冲设备将新的数据访问请求所包含的查询条件的描述信息与所述系统缓冲设备的临时数据项集合中的每个临时数据项进行内容匹配以确定每个临时数据项的内容匹配度,从多个临时数据项中选择内容匹配度大于匹配度阈值的至少一个选定的临时数据项,将所选择的至少一个选定的临时数据项发送给所述新的数据访问请求所指示的数据请求方,并且在所述系统缓冲设备的缓冲区内保存所述新的数据访问请求;在确定所述大数据存储系统内的所有存储设备中均没有正在运行的数据访问操作时,获取所述大数据存储系统内多个存储设备中每个存储设备的运行日志文件,并且基于当前的统计时间区间和每个存储设备的运行日志文件确定每个存储设备中存储的多个数据项的经过统计的访问信息,根据每个存储设备中存储的多个数据项的经过统计的访问信息确定每个存储设备的访问信息统计文件;其中所述访问信息统计文件包括数据项统计表,所述数据项统计表包括多个数据项记录,其中每个数据项记录的内容为6元组<数据项的标识符、被访问次数、统计起始时间、统计结束时间、存储尺寸、存储起始时间>;基于所述访问信息统计文件确定当前的统计时间区间内每个存储设备的所有数据项中被访问次数低于低频次数阈值的多个低频数据项,并确定每个存储设备中低频数据项的低频项数量以及每个低频数据项的存储尺寸;根据每个存储设备的每个低频数据项的存储尺寸确定每个存储设备的多个低频数据项中具有最大存储尺寸的低频存储项和具有最小存储尺寸的低频存储项;根据大数据存储系统的系统记录设备中的设备描述信息确定每个存储设备的总存储容量和大数据存储系统中所有存储设备的总数量,根据每个存储设备的存储信息区域中的存储信息文件来确定每个存储设备的空闲存储容量;基于低频项数量、每个低频数据项的存储尺寸、每个存储设备的总存储容量、每个存储设备的空闲存储容量、具有最大存储尺寸的低频存储项和具有最小存储尺寸的低频存储项计算每个存储设备的低频访问度:其中DAi为第i个存储设备的低频访问度,LTNi为第i个存储设备中低频数据项的低频项数量;Ci为第i个存储设备的总存储容量,Ri是第i个存储设备的空闲存储容量,Sij为第i个存储设备中第j个低频数据项的存储尺寸,Simax为第i个存储设备内所有低频数据项中单个低频数据项的最大存储尺寸,Simin为第i个存储设备内所有低频数据项中单个低频数据项的最小存储尺寸,其中i为自然数,DN≥i≥1并且j为自然数,LTNi≥j≥1,其中DN为大数据存储系统中所有存储设备的总数量并且DN≥200,其中LTNi≥100;2CN109271102A权利要求书2/6页将多个存储设备中低频访问度大于访问度阈值的存储设备确定为低访问度存储设备。2.根据权利要求1所述的方法,其中,当位于大数据存储系统外部的数据管理设备需要在大数据存储系统内的多个存储设备中识别低访问度存储设备时,所述数据管理设备向所述大数据存储系统发送在大数据存储系统内的多个存储设备中识别低访问度存储设备的识别请求;其中将所述大数据存储系统从任意的数据请求方所接收的新的数据访问请求重定向到所述大数据存储系统的系统缓冲设备而不将所接收的新的数据访问请求发送给多个存储设备中的相应的存储设备包括:以所述大数据存储系统接