预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共21页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN114840500A(43)申请公布日2022.08.02(21)申请号202210107769.8(22)申请日2022.01.28(30)优先权数据17/165,9122021.02.02US(71)申请人迈凌有限公司地址美国加利福尼亚州(72)发明人M·A·莫兰M·R·哈姆(74)专利代理机构广州嘉权专利商标事务所有限公司44205专利代理师韩茂(51)Int.Cl.G06F16/215(2019.01)G06F16/22(2019.01)G06F3/06(2006.01)权利要求书2页说明书11页附图7页(54)发明名称用于通过跳过选定数据进行重复数据删除的散列(57)摘要本发明公开了一种通过以下方法跨数据集计算指纹的系统,该方法包括:识别要散列的数据集,数据集包括数据块集;识别数据集内要跳过的数据;由散列引擎为数据集内除了要跳过的数据之外的数据块集中的每一个数据块生成散列;以及压缩数据。CN114840500ACN114840500A权利要求书1/2页1.一种方法,包括:识别要散列的数据集,所述数据集包括数据块集;识别所述数据集内要跳过的数据;由散列引擎为所述数据集内除了要跳过的所述数据之外的所述数据块集中的每一个数据块生成散列;以及压缩所述数据。2.根据权利要求1所述的方法,其中,识别所述数据集内要跳过的数据包括确定所述数据包括重复字段。3.根据权利要求2所述的方法,其中,所述重复字段具有特定的字节计数,其中为所述数据集内除了要跳过的所述数据之外的所述数据块集中的每一个数据块生成散列包括识别所述字段的第一字节并跳过数量等于所述字节计数的字节。4.根据权利要求1所述的方法,还包括:将已跳过的数据提供给记录用于存储;以及通过用户界面提供已跳过的数据的所述记录。5.根据权利要求1所述的方法,其中,由散列引擎为所述数据集内除了要跳过的所述数据之外的所述数据块集中的每一个数据块生成散列包括基于偏移和计数跳过数据。6.根据权利要求1所述的方法,其中,所述数据集内要跳过的所述数据包括以下数据中的至少一个:表征为模式的数据、标题、脚注、非易失性存储器快速(NVMe)保护数据或错误恢复控制数据。7.根据权利要求1所述的方法,其中,识别所述数据集内要跳过的数据包括:识别所述数据集内的跳过候选项;通过界面提供要提供的所述跳过候选项;以及接收对所述跳过候选项的确认。8.一种系统,包括:存储器;以及处理单元,耦接到所述存储器并且配置成使所述系统执行包括以下操作:识别要散列的数据集,所述数据集包括数据块集;识别所述数据集内要跳过的数据;由散列引擎为所述数据集内除了要跳过的所述数据之外的所述数据块集中的每一个数据块生成散列;以及压缩所述数据。9.根据权利要求8所述的系统,其中,识别所述数据集内要跳过的数据包括确定所述数据包括重复字段。10.根据权利要求9所述的系统,其中,所述重复字段具有特定的字节计数,其中所述为所述数据集内除了要跳过的所述数据之外的所述数据块集中的每一个数据块生成散列包括识别所述字段的第一字节并跳过数量等于所述字节计数的字节。11.根据权利要求8所述的系统,其中,所述操作还包括:将已跳过的数据提供给记录用于存储;以及通过用户界面提供已跳过的数据的所述记录。2CN114840500A权利要求书2/2页12.根据权利要求8所述的系统,其中,为所述数据集内除了要跳过的所述数据之外的所述数据块集中的每一个数据块生成散列包括基于偏移和计数跳过数据。13.根据权利要求8所述的系统,其中,所述数据集内要跳过的所述数据包括以下数据中的至少一个:表征为模式的数据、标题、脚注、非易失性存储器快速(NVMe)保护数据或错误恢复控制数据。14.根据权利要求8所述的系统,其中,识别所述数据集内要跳过的数据包括:识别所述数据集内的跳过候选项;通过界面提供要提供的所述跳过候选项;以及接收对所述跳过候选项的确认。15.一种系统,包括:重复数据删除管理器,配置成识别要散列的数据集,并识别所述数据集内要跳过的数据,其中所述数据集包括数据块集;散列引擎,配置成为所述数据集内除了要跳过的所述数据之外的所述数据块集中的每一个数据块生成散列;以及压缩管理器,配置成压缩所述数据。16.根据权利要求15所述的系统,其中,识别所述数据集内要跳过的数据包括确定所述数据包括重复字段。17.根据权利要求16所述的系统,其中,所述重复字段具有特定的字节计数,其中所述为所述数据集内除了要跳过的所述数据之外的所述数据块集中的每一个数据块生成散列包括识别所述字段的第一字节并跳过数量等于所述字节计数的字节。18.根据权利要求15所述的系统,其中,为所述数据集内除了要跳过的所述数据之外的所述数据块集中的每一个数据块生成散列包括基于