NAND 闪存基础 —— SLC / MLC / TLC / QLC 与 3D NAND

上一篇讲完 HDD,本篇进入 SSD 世界。SSD 的核心是 NAND 闪存——理解 NAND 的物理特性,才能理解为什么 SSD 有写放大、有寿命限制、有 GC 抖动这些”非旋转介质”的特殊问题。

NAND 的存储原理:浮栅 / 电荷陷阱

1
2
3
4
5
6
7
8
9
10
NAND 单元(floating gate type):

控制栅 (CG)

──┼── 介电层
──┼── 浮栅 FG(电荷"困"在这里)
──┼── 隧穿氧化层
──────┴────── 沟道
N+ N+
源 漏

关键原理:

  • 浮栅被绝缘层包围,电荷被”困”在里面,断电也不丢
  • 写入:高电压让电子穿过隧穿层进入浮栅
  • 擦除:反向高电压把电子拉出来
  • 读取:测沟道电流大小判断浮栅里有多少电荷

电荷陷阱(Charge Trap)NAND 用绝缘层代替浮栅,原理类似——3D NAND 主流是这个变种。

NAND 的”反人类”特性

NAND 和 DRAM/HDD 完全不同:

graph TB
  R[读:单 page
~50 μs] --> R1[页面 = 4-16 KB] W[写:单 page
~500 μs] --> W1[必须先擦除] E[擦除:整个 block
~5 ms] --> E1[block = 几百个 page
多 MB] E --> E2[擦写次数有限
SLC 10万 / TLC 3千]

关键事实

  1. 读 < 写 < 擦 在时间上数量级递增
  2. 写入必须先擦除,但擦除粒度比写大得多
  3. 擦写有寿命——次数有限就报废

这就是为什么 SSD 需要复杂的控制器——下一篇专门讲。

SLC / MLC / TLC / QLC / PLC

通过控制浮栅里的电荷量,一个单元可以存多个 bit:

graph LR
  SLC[SLC
1 bit/cell
2 个状态] --> MLC[MLC
2 bit/cell
4 个状态] MLC --> TLC[TLC
3 bit/cell
8 个状态] TLC --> QLC[QLC
4 bit/cell
16 个状态] QLC --> PLC[PLC
5 bit/cell
32 个状态]

关键参数对比:

SLC MLC TLC QLC PLC
bit/cell 1 2 3 4 5
电压级别 2 4 8 16 32
擦写次数 (P/E cycles) 50K-100K 10K 1-3K 300-1K <300
读延迟 极快
写延迟 极快 很慢 很慢
单 GB 价格 最贵 甜点 便宜 最便宜
应用 缓存 / 工业 退场 主流 容量盘 实验阶段

bit 数翻倍 ≠ 容量翻倍,因为相邻电压间距越来越窄、ECC 越来越重,可用容量没全部利用。

现实情况:MLC 已经退场

2020 年后 MLC(2 bit/cell)几乎退出主流市场——TLC 在企业级也站稳了。当前情况:

1
2
3
4
5
SLC:  仅做 SLC 缓存(其他 NAND 临时当 SLC 用)或工业卡
MLC: 几乎不再生产,少数老款
TLC: 数据中心主流(Solidigm/Samsung/Kioxia/海力士企业 SSD)
QLC: 容量盘(Solidigm D5 系列、三星 PM9D3a 等)
PLC: 在研,还没量产产品

TLC 是 2026 年的甜点——每 GB 比 QLC 贵 30-50%,但寿命是 3-10 倍。

平面 NAND 的死亡 → 3D NAND 的兴起

2D 平面 NAND 的极限

早期 NAND 单元在芯片上平铺

1
2
3
4
5
6
NAND die 表面:
┌──────────────────┐
│ □ □ □ □ □ □ □ □ │ ← 单元一个挨一个
│ □ □ □ □ □ □ □ □ │
│ □ □ □ □ □ □ □ □ │
└──────────────────┘

工艺缩到 1Xnm(约 14-16 nm)后,相邻单元间的电荷干扰、隧穿氧化层退化让密度无法再提——2D NAND 在 2014 年左右撞墙

3D NAND:把单元堆起来

1
2
3
4
5
6
7
8
3D NAND(垂直堆叠):
┌──────────────────┐
│ ▓▓▓▓▓▓▓▓ ← 64 / 128 / 232 / 321 / 432 层
│ ▓▓▓▓▓▓▓▓
│ ▓▓▓▓▓▓▓▓
│ ▓▓▓▓▓▓▓▓
└──────────────────┘
通过 String 管道穿过所有层

把单元做在垂直方向——横向工艺不用缩,密度靠堆层涨

1
2
3
4
5
6
7
8
2014:3D NAND 24 层 / 32 层(量产起步)
2017:64 层
2019:96 层
2021:128 层
2022:176 层
2024:232 层(YMTC 等已超过)
2025:321 层 / 218 层 + Hybrid Bonding(Wafer Bonding)
2026+:400+ 层在研

3D NAND 是过去十年存储工艺最重要的演进——比工艺微缩更重要。

关键技术:CuA / String Stacking / Hybrid Bonding

随着层数越堆越多,几个工艺难点逐步出现:

CuA(CMOS-under-Array)

把外围电路(CMOS)放到 NAND 阵列下面,省芯片面积。

String Stacking

一次 etch 几百层很难——把 200 多层分成两组,先做 100 多层、再做另 100 多层对位接上。

Hybrid Bonding(混合键合)

把 CMOS 和 NAND 分别在不同 wafer 上做,再焊接在一起。各做各的最优工艺。长江存储(YMTC)的 X-Tacking 是这条路的代表

待补充:YMTC X-Tacking 4 代当前进展。

NAND 颗粒供应商

NAND 是当前国产化推进相对成功的领域:

厂商 主要工艺 当前主流 国别
Samsung V-NAND V8 232 层(2024) 韩国
SK海力士 / Solidigm 4D / V7 232 层(合并 Solidigm 后) 韩 / 美
Kioxia / WD BiCS BiCS8 218 层 日 / 美
Micron Replacement Gate G9 232 层
YMTC(长江存储) Xtacking Xtacking 4.0 232 层

待补充:Solidigm(前 Intel NAND 业务卖给 SK 海力士子公司)、Kioxia/WD(合并/分离话题)的最新结构。

国内 YMTC 是少数能与国际同步层数的厂家——232 层 TLC 已规模量产。但受到出口管制影响,YMTC 在 2025-2026 年扩产受限。

NAND 颗粒上的”花样”

一颗 NAND die 不是简单”一堆 cell”,里面还有:

1
2
3
4
5
Plane(面)         一颗 die 内 2-4 个独立操作单元
Block(块) 擦除粒度,10-20 MB
Page(页) 读写粒度,4-16 KB
String(串) 3D NAND 一根穿过所有层的导线
WL/BL 字线/位线

多 plane 操作

现代 NAND 单 die 有 4-6 个 plane,可以并行读写——这是 SSD 控制器能堆出高 IOPS 的物理基础。

Open Block 问题

正在写入的 block 叫 “open block”。多个并发写如果落在同一 open block 上会互相影响——这是 SSD 多线程性能的考量点。

NAND 的可靠性问题

1. P/E Wear(擦写磨损)

每次擦除让隧穿氧化层退化一点。次数到达上限后,单元保电能力减弱。

2. Read Disturb(读干扰)

频繁读一行会”逐步擦”相邻行——很神奇但物理上确有影响。每读 N 次需要一次 refresh。

3. Data Retention(保电时间)

新写入的数据可以保 10 年,磨损到末期可能只能保几个月。断电存放 1 年的 SSD 数据可能丢失——这是不能用 SSD 替代磁带做长期归档的原因。

4. Program Disturb(写干扰)

写一个单元会影响相邻单元——尤其是 3D NAND 里同 String 上的相邻 cell。

应对:强 ECC + 后台 refresh + wear leveling,下一篇讲控制器时细说。

QLC 在企业级的崛起

QLC 写性能差、寿命短,按理不该上数据中心。但近 2 年 QLC 在企业市场份额快速增加:

理由:

  1. 冷数据 / 读多写少:对象存储、AI 训练数据集、CDN 边缘缓存——这些场景写入很少
  2. 超大容量:单盘 30-122 TB QLC SSD 已上市(Solidigm D5-P5336 是代表)
  3. 带宽 + IOPS 仍优于 HDD:即便是 QLC,也比 HDD 快百倍
graph LR
  HOT[热数据
OLTP / 高频读写] --> TLC[TLC SSD] WARM[温数据
分析 / 中频] --> TLC COLD[冷数据
归档 / 低频] --> QLC[QLC 大容量 SSD
or HDD] ARCHIVE[超冷数据
极少访问] --> HDD[HDD / 磁带]

QLC 正在接管”温-冷数据”层,把 HDD 边界向更冷的方向继续压。

一张总结

graph TB
  CELL[NAND 单元
浮栅或电荷陷阱] CELL --> SLC2[SLC 1bit] CELL --> MLC2[MLC 2bit] CELL --> TLC2[TLC 3bit] CELL --> QLC2[QLC 4bit] CELL --> PLC2[PLC 5bit] STR[3D NAND 结构] STR --> P1[Page 4-16KB 读写] STR --> P2[Block 多 MB 擦除] STR --> P3[Plane 并行] STR --> P4[Layer 232+ 堆叠]

小结

  • NAND 单元用浮栅或电荷陷阱存电荷,断电不丢
  • bit/cell 越多容量越大但写慢、寿命短:TLC 是企业级当前甜点
  • 平面 NAND 在 14nm 撞墙,3D NAND 用堆层涨密度
  • 当前 232 层是主流,长江存储跟上节奏
  • NAND 有 P/E wear、read disturb、data retention 等可靠性问题
  • QLC 在数据中心快速上量,吃 HDD 温/冷数据份额

下一篇讲 SSD 控制器和 FTL——把 NAND 的反人类特性藏起来的关键。