预览加载中,请您耐心等待几秒...
1/8
2/8
3/8
4/8
5/8
6/8
7/8
8/8

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN114356877A(43)申请公布日2022.04.15(21)申请号202111659487.0(22)申请日2021.12.30(71)申请人山东浪潮科学研究院有限公司地址250100山东省济南市高新浪潮路1036号S02号楼(72)发明人刘芳蕾刘佳星刘金伟张炜刚(74)专利代理机构济南信达专利事务所有限公司37100代理人姜鹏(51)Int.Cl.G06F16/18(2019.01)G06F16/13(2019.01)G06F9/50(2006.01)G06F9/54(2006.01)权利要求书1页说明书4页附图2页(54)发明名称一种基于持久内存的日志结构合并树分级存储方法及系统(57)摘要本发明公开了一种基于持久内存的日志结构合并树分级存储方法及系统,属于内存数据存储技术领域。本发明的基于持久内存的日志结构合并树分级存储方法基于持久内存分配器、文件二级索引、动态键值分离,将日志结构合并树分级存储在普通内存、持久内存和固态硬盘,普通内存保留核心关键元数据,预写日志WAL和LSM‑TreeL0‑L2层数据记录在持久内存中,L3‑L6层文件数据存放在固态硬盘中。该发明的基于持久内存的日志结构合并树分级存储方法能够充分发挥持久内存低延迟和硬盘大容量的特性,提高数据合并和数据访问效率,具有很好的推广应用价值。CN114356877ACN114356877A权利要求书1/1页1.一种基于持久内存的日志结构合并树分级存储方法,其特征在于:该方法基于持久内存分配器、文件二级索引、动态键值分离,将日志结构合并树分级存储在普通内存、持久内存和固态硬盘,普通内存保留核心关键元数据,预写日志WAL和LSM‑TreeL0‑L2层数据记录在持久内存中,L3‑L6层文件数据存放在固态硬盘中。2.根据权利要求1所述的基于持久内存的日志结构合并树分级存储方法,其特征在于:将LSM‑Tree结构根据数据访问热度、用户访问等待开销划分数据分布。3.根据权利要求2所述的基于持久内存的日志结构合并树分级存储方法,其特征在于:持久内存分配器管理持久内存空间,为每种类型的数据文件构建内存池提供预分配空间。4.根据权利要求3所述的基于持久内存的日志结构合并树分级存储方法,其特征在于:所述持久内存分配器负责空间分配顺序、空间分配并发、空间分配统计和空间阀值触发后台任务。5.根据权利要求4所述的基于持久内存的日志结构合并树分级存储方法,其特征在于:文件二级索引结构用于记录LSM‑Tree各层SST文件的Key范围及前缀布隆过滤器信息。6.根据权利要求5所述的基于持久内存的日志结构合并树分级存储方法,其特征在于:动态键值分离阀值根据用户配置策略及持久内存空间状态,动态调整键值分离阀值,支持不同存储介质内采用不同键值分离策略。7.一种基于持久内存的日志结构合并树分级存储系统,其特征在于:包括持久内存分配器模块、文件二级索引模块、动态键值分离模块,将日志结构合并树分级存储在普通内存、持久内存和固态硬盘,普通内存保留核心关键元数据,预写日志WAL和LSM‑TreeL0‑L2层数据记录在持久内存中,L3‑L6层文件数据存放在固态硬盘中。8.根据权利要求7所述的基于持久内存的日志结构合并树分级存储系统,其特征在于:持久内存分配器模块管理持久内存空间,为每种类型的数据文件构建内存池提供预分配空间,负责空间分配顺序、空间分配并发、空间分配统计和空间阀值触发后台任务。9.根据权利要求8所述的基于持久内存的日志结构合并树分级存储系统,其特征在于:文件二级索引模块用于记录LSM‑Tree各层SST文件的Key范围及前缀布隆过滤器信息。10.根据权利要求9所述的基于持久内存的日志结构合并树分级存储系统,其特征在于:动态键值分离模块根据用户配置策略及持久内存空间状态,动态调整键值分离阀值,支持不同存储介质内采用不同键值分离策略。2CN114356877A说明书1/4页一种基于持久内存的日志结构合并树分级存储方法及系统技术领域[0001]本发明涉及内存数据存储技术领域,具体提供一种基于持久内存的日志结构合并树分级存储方法及系统。背景技术[0002]LSM‑Tree全称是LogStructuredMergeTree,是一种分层,有序,面向写多读少场景的数据结构,其核心思想是充分了利用了硬盘批量顺序写要远比随机写性能高的特点,广泛应用于NoSQL系统,如HBase、RocksDB、Cassandra等。LSM‑Tree基于上述的实现将随机写转化为顺序写,从而获得非常优秀的写性能,而作为代价带来了大量的重复写入。写放大意味着更多的读写,影响数据库系统的持续写入的带宽,同时加速硬盘尤其是固态盘的寿命衰减。所以解决写放大就成了