KV存储（2）：LSM-Tree 与 B+Tree 的权衡

1 分钟阅读

发布于： April 20, 2021

前言

在 KV 存储系统的实现中，存储引擎的选择至关重要。LSM-Tree 和 B+Tree 是两种最主流的存储引擎，它们各有优劣。本文将从 KV 存储系统的实际应用角度，对比这两种存储引擎在 KV 存储场景下的表现，帮助读者理解如何为 KV 存储系统选择合适的存储引擎。

注：本文聚焦于 KV 存储系统的实际应用场景。关于 B+Tree 和 LSM 的通用原理和底层机制，请参考「存储基础系列」的相关文章。

1. LSM-Tree 概述

LSM-Tree（Log-Structured Merge-Tree）是一种写优化的存储结构，将随机写转换为顺序写，从而提高写入性能。

1.1 基本结构

LSM-Tree 通常包含：

MemTable：内存中的有序表，接收写入请求
SSTable：磁盘上的有序表，由 MemTable 刷盘生成
Compaction：定期合并多个 SSTable，减少文件数量

1.2 写入流程

写入请求首先进入 MemTable
当 MemTable 达到阈值时，刷盘生成 SSTable
后台线程定期执行 Compaction，合并多个 SSTable

2. B+Tree 概述

B+Tree 是一种平衡多路搜索树，广泛应用于数据库和文件系统。

2.1 基本结构

B+Tree 的特点：

所有数据存储在叶子节点
内部节点只存储索引信息
节点大小通常等于磁盘页大小

2.2 写入流程

查找目标键所在的叶子节点
在叶子节点中插入或更新数据
如果节点溢出，进行分裂操作
更新父节点的索引信息

3. 性能对比

3.1 写入性能

LSM-Tree 优势：

写入是顺序的，性能高
批量写入效率高
写放大相对可控

B+Tree 劣势：

随机写入需要多次磁盘 IO
节点分裂可能导致写放大
需要维护索引结构

3.2 读取性能

B+Tree 优势：

查询路径固定，通常只需要 O(log n) 次 IO
点查询性能稳定

LSM-Tree 劣势：

可能需要查询多个 SSTable
需要合并多个版本的数据
点查询性能可能不稳定

3.3 范围查询

B+Tree 优势：

叶子节点有序，范围查询高效
顺序扫描性能好

LSM-Tree 特点：

每个 SSTable 内部有序
需要合并多个 SSTable 的结果
性能取决于 Compaction 策略

4. 空间效率

4.1 写放大

LSM-Tree：

写放大主要来自 Compaction
可以通过调整 Compaction 策略控制

B+Tree：

写放大主要来自节点分裂和索引更新
相对可控

4.2 空间利用率

B+Tree：

节点分裂可能导致空间浪费
需要定期整理碎片

LSM-Tree：

Compaction 可以回收空间
空间利用率相对较高

5. 一致性保证

5.1 事务支持

B+Tree：

天然支持事务
可以通过锁机制保证一致性

LSM-Tree：

需要额外的机制保证一致性
通常通过 WAL 和版本控制实现

5.2 崩溃恢复

LSM-Tree：

通过 WAL 恢复未刷盘的数据
恢复相对简单

B+Tree：

需要恢复索引结构
恢复过程可能较复杂

6. 适用场景

6.1 选择 LSM-Tree 的场景

写多读少的场景
需要高写入吞吐量
数据可以容忍一定的读延迟
需要良好的压缩比

6.2 选择 B+Tree 的场景

读多写少的场景
需要稳定的点查询性能
需要频繁的范围查询
需要强一致性保证

7. KV 存储系统中的实际应用

7.1 典型 KV 存储系统的选择

使用 LSM-Tree 的 KV 存储系统：

RocksDB：Facebook 开发，广泛用于分布式系统
LevelDB：Google 开发，RocksDB 的前身
BadgerDB：Go 语言实现，适合 Go 生态
Cassandra：分布式 NoSQL 数据库，底层使用 LSM

使用 B+Tree 的 KV 存储系统：

Berkeley DB：经典的嵌入式数据库
WiredTiger：MongoDB 的存储引擎
InnoDB：MySQL 的存储引擎（虽然主要用于关系型数据库，但也支持 KV 操作）

7.2 混合方案

一些 KV 存储系统采用混合方案：

内存中使用 B+Tree：利用 B+Tree 的点查询优势
磁盘上使用 LSM-Tree：利用 LSM-Tree 的写入优势
根据数据热度动态选择：热数据用 B+Tree，冷数据用 LSM-Tree

7.3 KV 存储系统的特殊考虑

在 KV 存储系统中，还需要考虑：

批量操作：KV 存储通常支持批量 Put/Get，LSM-Tree 的批量写入优势更明显
TTL 支持：KV 存储需要支持过期删除，LSM-Tree 的 tombstone 机制更适合
压缩支持：KV 存储的 Value 可能很大，LSM-Tree 的压缩支持更好
多版本支持：KV 存储可能需要多版本，LSM-Tree 天然支持

8. 性能调优建议

8.1 LSM-Tree 的调优

对于使用 LSM-Tree 的 KV 存储系统：

调整 Compaction 策略：根据读写比例选择 Leveled 或 Tiered
优化 MemTable 大小：平衡内存使用和刷盘频率
配置 Bloom Filter：减少读放大
调整层级大小：控制写放大和读放大

8.2 B+Tree 的调优

对于使用 B+Tree 的 KV 存储系统：

调整页大小：根据 Value 大小选择合适的页大小
优化 Buffer Pool：提高缓存命中率
调整分裂策略：减少写放大
优化索引结构：提高查询性能

9. 小结

LSM-Tree 和 B+Tree 各有优劣，选择哪种存储引擎需要根据具体的 KV 存储应用场景来决定。

核心要点：

LSM-Tree 适合：写多读少、批量写入、需要高压缩比、支持 TTL 的场景
B+Tree 适合：读多写少、点查询为主、需要稳定延迟、范围查询多的场景
混合方案：可以兼顾两者的优势，但实现复杂度更高

在 KV 存储系统中的实际应用：

大多数现代 KV 存储系统选择 LSM-Tree，因为 KV 存储通常写多读少
一些嵌入式 KV 存储系统选择 B+Tree，因为需要稳定的点查询性能
混合方案在特定场景下可以提供最佳性能

在实际的 KV 存储系统中，也有采用混合方案的，比如在内存中使用 B+Tree，在磁盘上使用 LSM-Tree，以兼顾两者的优势。选择存储引擎时，需要综合考虑读写比例、延迟要求、一致性要求、运维复杂度等多个因素。