预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共21页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN114840502A(43)申请公布日2022.08.02(21)申请号202210108710.0(22)申请日2022.01.28(30)优先权数据17/165,9102021.02.02US(71)申请人迈凌有限公司地址美国加利福尼亚州(72)发明人M·A·莫兰M·R·哈姆(74)专利代理机构广州嘉权专利商标事务所有限公司44205专利代理师韩茂(51)Int.Cl.G06F16/215(2019.01)G06F16/22(2019.01)G06F3/06(2006.01)权利要求书2页说明书11页附图7页(54)发明名称使用不同的散列大小和压缩大小进行散列(57)摘要本发明公开了一种用于通过以下方法对数据集进行散列的系统,该方法包括:识别要基于散列块大小进行重复数据删除以及要基于压缩块大小进行压缩的数据集,其中,散列块大小小于压缩块大小;基于散列块大小定义数据集内的数据块集;为数据集内的数据块集中的每一个数据块生成散列;基于数据块的相应散列对数据集内的数据块进行重复数据删除;以及基于压缩块大小对数据集进行压缩。CN114840502ACN114840502A权利要求书1/2页1.一种方法,包括:识别要基于散列块大小进行重复数据删除以及要基于压缩块大小进行压缩的数据集,其中所述散列块大小小于所述压缩块大小;基于所述散列块大小定义所述数据集内的数据块集;为所述数据集内的所述数据块集中的每一个数据块生成散列;基于所述数据块的相应散列对所述数据集内的数据块进行重复数据删除;以及基于所述压缩块大小对所述数据集进行压缩。2.根据权利要求1所述的方法,其中,所述压缩块大小是所述散列块大小的至少两倍。3.根据权利要求1所述的方法,其中,所述散列块大小是所述压缩块大小的除数。4.根据权利要求1所述的方法,其中,所述压缩块大小不是所述散列块大小的整数倍,其中所述数据块集的第二数据块具有唯一的散列块大小,其中基于所述压缩块大小对所述数据集进行压缩包括以下至少一项:避免压缩所述第二数据块;或者丢弃与所述第二数据块相关联的散列。5.根据权利要求1所述的方法,还包括:通过用户界面接收指示所述散列块大小的用户输入;以及基于所述用户输入设置所述散列块大小。6.根据权利要求1所述的方法,其中,所述数据集是电子文件,其中所述压缩块大小等于所述电子文件的大小。7.根据权利要求1所述的方法,其中,经过重复数据删除的数据块不被压缩。8.一种方法,包括:识别要基于散列块大小进行重复数据删除以及要基于压缩块大小进行压缩的数据集,其中所述散列块大小小于所述压缩块大小;基于所述散列块大小定义所述数据集内的数据块集;生成第一指令,以为所述数据集内的所述数据块集中的每一个数据块生成散列;生成第二指令,以基于所述数据块的相应散列对所述数据集内的数据块进行重复数据删除;以及生成第三指令,以基于所述压缩块大小对所述数据集进行压缩。9.根据权利要求8所述的方法,其中,所述压缩块大小是所述散列块大小的至少两倍。10.根据权利要求8所述的方法,其中,所述散列块大小是所述压缩块大小的除数。11.根据权利要求8所述的方法,其中,所述压缩块大小不是所述散列块大小的整数倍,其中所述数据块集的第二数据块具有唯一的散列块大小,其中基于所述压缩块大小对所述数据集进行压缩的所述第三指令包括执行以下至少一项的第四指令:避免压缩所述第二数据块;或者丢弃与所述第二数据块相关联的散列。12.根据权利要求8所述的方法,还包括:通过用户界面接收指示所述散列块大小的用户输入;以及基于所述用户输入设置所述散列块大小。13.根据权利要求8所述的方法,其中,所述数据集是电子文件,其中所述压缩块大小等2CN114840502A权利要求书2/2页于所述电子文件的大小。14.根据权利要求8所述的方法,其中,经过重复数据删除的数据块不被压缩。15.一种系统,包括:存储器;以及处理单元,耦接到所述存储器并且配置成使所述系统执行包括以下操作:识别要基于散列块大小进行重复数据删除的数据集,其中所述散列块大小小于与所述数据集相关联的压缩块大小;基于所述散列块大小定义所述数据集内的数据块集;为所述数据集内的所述数据块集中的每一个数据块生成散列;以及基于所述数据块的相应散列对所述数据集内的数据块进行重复数据删除。16.根据权利要求15所述的系统,其中,所述压缩块大小是所述散列块大小的至少两倍。17.根据权利要求15所述的系统,其中,所述散列块大小是所述压缩块大小的除数。18.根据权利要求15所述的系统,其中,所述压缩块大小不是所述散列块大小的整数倍,其中所述数据块集的第二数据块具有唯一的散列块大小。19.根据权利要求15所述的系统,其中,所述操作还包括:通过用户界面接收指示所