TinyKV Lab 路线图

发表于 2026-06-02 分类于分布式系统

来源：本地 TinyKV 项目文件：tinykv-understanding/labs/tinykv-lab-roadmap.md。
顺序：路线图 / Lab1 / Lab2 / Lab3 / Lab3B / Lab4 / 测试。

从单机 KV 到事务层的路线图。

我会先从这张路线图看 TinyKV。它不是一上来就写一个“分布式数据库”，而是每个 Lab 只加一类能力：先能落盘，再能复制，再能把 key 空间拆开，最后才谈事务。这样读起来不乱，也更像一个真实系统逐步长出来的过程。

资料来源：

Project 1 StandaloneKV: https://yunpengn.github.io/tinykv/doc/project1-StandaloneKV.html
Project 2 RaftKV: https://yunpengn.github.io/tinykv/doc/project2-RaftKV.html
Project 3 MultiRaftKV: https://yunpengn.github.io/tinykv/doc/project3-MultiRaftKV.html
Project 4 Transactions: https://github.com/talent-plan/tinykv/blob/course/doc/project4-Transaction.md

说明：TinyKV 官方叫 Project 1/2/3/4，简历里很多人会叫 Lab 1/2/3/4。下面先按 Lab 来写。

总路线

TinyKV 的路线不是一上来就做分布式，而是逐层加能力：

Lab1: 单机 KV
  -> Lab2: 单 Raft Group 的高可用 KV
  -> Lab3: 多 Raft Group / Region / 调度
  -> Lab4: MVCC / Percolator 事务

把官方 Project、测试命令、代码范围放到一张表里：

Lab	官方阶段	主要工作	主要测试
Lab1	Project1	`StandaloneStorage` + Raw KV API	`make project1`
Lab2A	Project2 Part A	Raft 选主、日志复制、RawNode/Ready	`make project2aa`、`project2ab`、`project2ac`、`project2a`
Lab2B	Project2 Part B	raftstore 把 KV 请求走 Raft 后再 apply	`make project2b`
Lab2C	Project2 Part C	log GC、snapshot、落后副本恢复	`make project2c`
Lab3A	Project3 Part A	conf change、leader transfer	`make project3a`
Lab3B	Project3 Part B	ChangePeer、TransferLeader、Region Split	`make project3b`
Lab3C	Project3 Part C	scheduler heartbeat、balance region	`make project3c`
Lab4A	Project4 Part A	MVCC 版本、锁、提交记录	`make project4a`
Lab4B	Project4 Part B	`KvGet`、`KvPrewrite`、`KvCommit`	`make project4b`
Lab4C	Project4 Part C	`KvScan`、rollback、check/resolve lock	`make project4c`

本地当前进度

结合最近的本地对话和回归结果，现在可以把这个仓库的进度看成：

Lab	当前状态	最近验证
Lab1	已完成	`make project1` 通过
Lab2	已完成	`make project2` 通过，并额外检查日志无失败关键字
Lab3	已完成	`make project3` 通过，并额外检查日志无失败关键字
Lab4	已完成	`make project4` 通过，Lab4A/B/C 全部 PASS

这里特别要记住：Lab2B、Lab2C、Lab3B 的 Makefile 子命令里有 || true，所以“完整通过”的判断不是只看 make 退出码，而是还要确认输出或日志里没有 FAIL、panic、fatal error。

从学习路径上看，我们本地对话基本是按这条线推进的：

先理解每个 Lab 要做什么
  -> 再按 Lab4A/B/C 拆开实现事务
  -> 每完成一段就补代码注释和中文 commit 描述
  -> 最后从 Lab1 到 Lab4 全量回归确认

和 MIT 6.5840 的大致关系：

TinyKV Lab1  ~= MIT Lab2 的一部分：单机 KV，但 TinyKV 更偏 Badger 存储封装
TinyKV Lab2  ~= MIT Lab3 + Lab4：Raft + RaftKV
TinyKV Lab3  ~= MIT Lab5 的一部分：分片/多组复制，但 TinyKV 更像 TiKV Region
TinyKV Lab4  = MIT 标准实验没有：MVCC + 分布式事务

Lab1: StandaloneKV

一句话：实现一个单机版 KV 数据库服务。

这里还没有 Raft、没有分布式、没有副本、没有事务。客户端通过 gRPC 发请求，服务端直接读写本地 BadgerDB。

Lab1 要实现什么

Lab1 分成两块：

实现单机存储引擎 StandaloneStorage
实现 Raw KV 的 RPC handler

1. 实现 StandaloneStorage

Column Family 是什么

Lab1 还要求支持 Column Family，简称 CF。

你可以把 CF 理解成“同一个 BadgerDB 里隔出来的多个小数据库”：

default CF:
  key1 -> valueA

write CF:
  key1 -> valueB

lock CF:
  key1 -> valueC

同一个 key1 在不同 CF 里可以有不同的值。

Badger 本身不直接支持 CF，所以 TinyKV 用 engine_util 做了一层模拟：把 CF 前缀拼到真实 key 上。

简单理解：

1 2	用户看到: cf = default, key = abc 底层存储: default_abc

Lab1 做 CF 的原因：Lab4 的 MVCC/事务会用到 default、write、lock 三个 CF。

2. 实现 Raw KV RPC Handler

Lab1 的请求流程

以 RawPut 为例：

client
  -> gRPC RawPut
  -> kv/server/raw_api.go
  -> StandaloneStorage.Write
  -> engine_util
  -> BadgerDB

以 RawGet 为例：

client
  -> gRPC RawGet
  -> kv/server/raw_api.go
  -> StandaloneStorage.Reader
  -> reader.GetCF
  -> engine_util
  -> BadgerDB snapshot

Lab1 不做什么

Lab1 不需要做：

Raft
leader election
log replication
snapshot
Region
多副本一致性
分布式事务
MVCC
Percolator

所以它本质上是后面所有功能的本地存储基础。

Lab1 和 MIT 6.5840 的关系

Lab1 最像 MIT 6.5840 的 Lab2，但只像一部分。

相同点：

都是 KV 服务。
都有 Get/Put 这种基本操作。
都还不是 RaftKV。

不同点：

MIT Lab2 更强调 RPC、丢包重试、版本号条件写、线性一致语义。
TinyKV Lab1 更强调 BadgerDB 封装、Column Family、Scan、存储接口抽象。
TinyKV Lab1 是为了后面的 TiKV 风格架构铺路。

如果面试时解释，可以这么说：

TinyKV Lab1 是单机存储层，不涉及分布式一致性。它主要实现 Badger 上的一层 Storage 抽象和 Raw KV RPC，包括 Get、Put、Delete、Scan，以及 Column Family 支持。这个 Lab 更像是在给后面的 RaftKV 和事务层打地基。

Lab1 检查点

完成后应该能通过：

1	make project1

理解上应该能回答：

Storage.Write 和 Storage.Reader 分别负责什么？
为什么 Reader 要用 snapshot/transaction？
CF 是什么，Badger 不支持 CF 时 TinyKV 怎么模拟？
RawGet 和 RawScan 怎么从 storage 里读数据？
Lab1 为什么暂时不需要关心 kvrpcpb.Context？

Lab2: RaftKV

一句话：把 Lab1 的单机 KV 变成基于 Raft 的高可用 KV。

主要分三块：

1
2
3

Part A: 实现 Raft 本体
Part B: 用 Raft 复制 KV 请求
Part C: 做 Raft log GC 和 snapshot

和 MIT 的关系：

1
2
3

TinyKV Lab2 Part A ~= MIT Lab3 Raft
TinyKV Lab2 Part B ~= MIT Lab4 RaftKV
TinyKV Lab2 Part C ~= MIT Lab3/4 的 snapshot

具体拆开看：

阶段	要做什么	主要文件
Lab2A / 2AA	选主、投票、心跳、leader noop	`raft/raft.go`
Lab2A / 2AB	日志复制、日志冲突处理、推进 commit	`raft/log.go`、`raft/raft.go`
Lab2A / 2AC	`RawNode`、`Ready`、`Advance`	`raft/rawnode.go`
Lab2B	持久化 `Ready`，propose/apply KV command，回调客户端	`kv/raftstore/peer_storage.go`、`kv/raftstore/peer_msg_handler.go`
Lab2C	CompactLog、raftlog GC、snapshot 发送和恢复	`raft/raft.go`、`kv/raftstore/peer_storage.go`、`kv/raftstore/peer_msg_handler.go`

Lab3: MultiRaftKV

一句话：从“一个 Raft group 管全部 key”升级成“多个 Region / 多个 Raft group 分摊 key 空间”。

主要分三块：

1
2
3

Part A: Raft membership change 和 leader transfer
Part B: raftstore 支持 ChangePeer、TransferLeader、Region Split
Part C: Scheduler 收集 heartbeat，并做 balance region

和 MIT 的关系：

1
2
3

TinyKV Lab3 和 MIT Lab5 都在做“分片 + 多组复制”
但 MIT 是固定 shard + shard controller
TinyKV 是 range region + split + scheduler，更像 TiKV

具体拆开看：

阶段	要做什么	主要文件
Lab3A	Raft 层支持 `AddNode`、`RemoveNode`、`TransferLeader`	`raft/raft.go`、`raft/rawnode.go`
Lab3B	raftstore 执行 `ChangePeer`、`TransferLeader`、`Split`，维护 RegionEpoch 和 meta	`kv/raftstore/peer_msg_handler.go`、`kv/raftstore/peer.go`
Lab3C	Scheduler 接收 heartbeat，判断 Region 信息新旧，生成 `MovePeer` operator	`scheduler/server/cluster.go`、`scheduler/server/schedulers/balance_region.go`

Lab4: Transactions

一句话：在 KV 上实现 MVCC 和 Percolator 风格事务。

主要分三块：

1
2
3

Part A: MVCC 存储层
Part B: KvGet / KvPrewrite / KvCommit
Part C: KvScan / CheckTxnStatus / BatchRollback / ResolveLock

和 MIT 的关系：

1 2	MIT 6.5840 标准实验基本没有这一层这是 TinyKV 更数据库内核的部分

具体拆开看：

阶段	要做什么	主要文件
Lab4A	实现 MVCC 工具：按 `start_ts` 读可见版本，读写 lock/write/default	`kv/transaction/mvcc/transaction.go`、`kv/transaction/mvcc/scanner.go`
Lab4B	实现事务正常路径：`KvGet`、`KvPrewrite`、`KvCommit`	`kv/server/server.go`
Lab4C	实现异常和收尾路径：`KvScan`、`KvCheckTxnStatus`、`KvBatchRollback`、`KvResolveLock`	`kv/server/server.go`、`kv/transaction/mvcc/scanner.go`