一种基于持久内存的日志结构合并树分级存储方法及系统-豆柴文库

一种基于持久内存的日志结构合并树分级存储方法及系统.pdf

2023-11-06

10金币

482KB

8页

宏硕****mo

实名认证

内容提供者

1/8

2/8

3/8

4/8

5/8

6/8

7/8

8/8

在线预览结束，喜欢就下载吧，查找使用更方便

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN114356877A(43)申请公布日2022.04.15(21)申请号202111659487.0(22)申请日2021.12.30(71)申请人山东浪潮科学研究院有限公司地址250100山东省济南市高新浪潮路1036号S02号楼(72)发明人刘芳蕾刘佳星刘金伟张炜刚(74)专利代理机构济南信达专利事务所有限公司37100代理人姜鹏(51)Int.Cl.G06F16/18(2019.01)G06F16/13(2019.01)G06F9/50(2006.01)G06F9/54(2006.01)权利要求书1页说明书4页附图2页(54)发明名称一种基于持久内存的日志结构合并树分级存储方法及系统(57)摘要本发明公开了一种基于持久内存的日志结构合并树分级存储方法及系统，属于内存数据存储技术领域。本发明的基于持久内存的日志结构合并树分级存储方法基于持久内存分配器、文件二级索引、动态键值分离，将日志结构合并树分级存储在普通内存、持久内存和固态硬盘，普通内存保留核心关键元数据，预写日志WAL和LSM‑TreeL0‑L2层数据记录在持久内存中，L3‑L6层文件数据存放在固态硬盘中。该发明的基于持久内存的日志结构合并树分级存储方法能够充分发挥持久内存低延迟和硬盘大容量的特性，提高数据合并和数据访问效率，具有很好的推广应用价值。CN114356877ACN114356877A权利要求书1/1页1.一种基于持久内存的日志结构合并树分级存储方法，其特征在于：该方法基于持久内存分配器、文件二级索引、动态键值分离，将日志结构合并树分级存储在普通内存、持久内存和固态硬盘，普通内存保留核心关键元数据，预写日志WAL和LSM‑TreeL0‑L2层数据记录在持久内存中，L3‑L6层文件数据存放在固态硬盘中。2.根据权利要求1所述的基于持久内存的日志结构合并树分级存储方法，其特征在于：将LSM‑Tree结构根据数据访问热度、用户访问等待开销划分数据分布。3.根据权利要求2所述的基于持久内存的日志结构合并树分级存储方法，其特征在于：持久内存分配器管理持久内存空间，为每种类型的数据文件构建内存池提供预分配空间。4.根据权利要求3所述的基于持久内存的日志结构合并树分级存储方法，其特征在于：所述持久内存分配器负责空间分配顺序、空间分配并发、空间分配统计和空间阀值触发后台任务。5.根据权利要求4所述的基于持久内存的日志结构合并树分级存储方法，其特征在于：文件二级索引结构用于记录LSM‑Tree各层SST文件的Key范围及前缀布隆过滤器信息。6.根据权利要求5所述的基于持久内存的日志结构合并树分级存储方法，其特征在于：动态键值分离阀值根据用户配置策略及持久内存空间状态，动态调整键值分离阀值，支持不同存储介质内采用不同键值分离策略。7.一种基于持久内存的日志结构合并树分级存储系统，其特征在于：包括持久内存分配器模块、文件二级索引模块、动态键值分离模块，将日志结构合并树分级存储在普通内存、持久内存和固态硬盘，普通内存保留核心关键元数据，预写日志WAL和LSM‑TreeL0‑L2层数据记录在持久内存中，L3‑L6层文件数据存放在固态硬盘中。8.根据权利要求7所述的基于持久内存的日志结构合并树分级存储系统，其特征在于：持久内存分配器模块管理持久内存空间，为每种类型的数据文件构建内存池提供预分配空间，负责空间分配顺序、空间分配并发、空间分配统计和空间阀值触发后台任务。9.根据权利要求8所述的基于持久内存的日志结构合并树分级存储系统，其特征在于：文件二级索引模块用于记录LSM‑Tree各层SST文件的Key范围及前缀布隆过滤器信息。10.根据权利要求9所述的基于持久内存的日志结构合并树分级存储系统，其特征在于：动态键值分离模块根据用户配置策略及持久内存空间状态，动态调整键值分离阀值，支持不同存储介质内采用不同键值分离策略。2CN114356877A说明书1/4页一种基于持久内存的日志结构合并树分级存储方法及系统技术领域[0001]本发明涉及内存数据存储技术领域，具体提供一种基于持久内存的日志结构合并树分级存储方法及系统。背景技术[0002]LSM‑Tree全称是LogStructuredMergeTree，是一种分层，有序，面向写多读少场景的数据结构，其核心思想是充分了利用了硬盘批量顺序写要远比随机写性能高的特点，广泛应用于NoSQL系统，如HBase、RocksDB、Cassandra等。LSM‑Tree基于上述的实现将随机写转化为顺序写，从而获得非常优秀的写性能，而作为代价带来了大量的重复写入。写放大意味着更多的读写，影响数据库系统的持续写入的带宽，同时加速硬盘尤其是固态盘的寿命衰减。所以解决写放大就成了

相关资料

一种基于持久内存的日志结构合并树分级存储方法及系统.pdf

本发明公开了一种基于持久内存的日志结构合并树分级存储方法及系统，属于内存数据存储技术领域。本发明的基于持久内存的日志结构合并树分级存储方法基于持久内存分配器、文件二级索引、动态键值分离，将日志结构合并树分级存储在普通内存、持久内存和固态硬盘，普通内存保留核心关键元数据，预写日志WAL和LSM‑TreeL0‑L2层数据记录在持久内存中，L3‑L6层文件数据存放在固态硬盘中。该发明的基于持久内存的日志结构合并树分级存储方法能够充分发挥持久内存低延迟和硬盘大容量的特性，提高数据合并和数据访问效率，具有很好的推

2023-11-06

482KB

一种基于日志结构合并树的两阶段合并方法.pdf

本发明涉及一种基于日志结构合并树的两阶段合并方法，包括以下步骤：1)根据不均衡得分在开源系统中选出空间分布最不合理的一层；2)根据轮询原则选出空间分布最不合理一层中的目标文件；3)将目标文件按覆盖相同键值范围的下层文件分割碎片，将每一碎片与对应键值范围的下层文件链接，并为每一下层文件增加SliceLink；4)检查每一下层文件SliceLink数量，若所有下层文件SliceLink数量均不超过预设阈值则进入步骤2)，直到存在下层文件SliceLink数量超过预设阈值则进入步骤5)；5)将SliceLink

2023-09-01

515KB

一种基于持久性内存的列式存储方法、装置及设备.pdf

本申请公开了一种基于持久性内存的列式存储方法，该方法将文件转换为哈希结构数据并存储在持久性内存上，由于持久性内存具备字节寻址及非易失性，因此能够在数据读写过程中避免经过文件系统栈，大幅地提升数据查询速度；相比传统列式存储，该存储方式更易于实现修改、删除等实时数据操作，扩大了列式存储的应用场景；此外，该方法了采用一种逻辑简单的且占用空间极小的位图索引数据描述列块上的数据分布情况，避免了记录粉碎和组装算法的复杂性，在保留列式存储优势的同时简化存储逻辑，进一步提升列式存储的数据读写性能。此外，本申请还公开了一种

2023-11-13

786KB

一种基于安全内存的存储优化方法及系统.pdf

本说明书一个或多个实施例涉及一种基于安全内存的存储优化方法；所述方法包括：获取安全内存的可用容量；获取模型或者模型某一层的待计算数据；获取所述模型或者模型某一层的权重；根据所述权重，以及所述待计算数据，确定内存需求量；所述内存需求量为完成计算预计需要占用的安全内存的存储空间；将所述内存需求量与所述内存的可用容量进行对比；当比较结果满足预设条件时，对所述权重进行修正，获取量化权重，基于所述量化权重进行计算；所述量化权重对内存的需求量小于所述权重对内容的需求量。

2023-05-25

554KB

一种基于内存映射的异步日志构建方法和系统.pdf

本发明公开了一种基于内存映射的异步日志构建方法和系统，涉及互联网技术领域。该基于内存映射的异步日志构建方法，有效提升了传统日志库的性能，提高了日志库的可靠性，提供了一种简单易用的日志框架，使用异步模式可以解决传统同步日志库的性能问题，异步模式使用双buffer缓冲的设计，提高了传统异步日志的性能；基于mmap内存映射的存储模块，解决了传统日志库需要反复进行系统调用的问题，通过实现内存与文件的相互映射，实现日志文件的高性能读写与日志不丢失，并且设计接口支持自定义输出的设计，用户可通过注册日志输出，使用自定义

2023-06-07

552KB