NAND 闪存基础 —— SLC / MLC / TLC / QLC 与 3D NAND
上一篇讲完 HDD,本篇进入 SSD 世界。SSD 的核心是 NAND 闪存——理解 NAND 的物理特性,才能理解为什么 SSD 有写放大、有寿命限制、有 GC 抖动这些”非旋转介质”的特殊问题。
NAND 的存储原理:浮栅 / 电荷陷阱
1 | |
关键原理:
- 浮栅被绝缘层包围,电荷被”困”在里面,断电也不丢
- 写入:高电压让电子穿过隧穿层进入浮栅
- 擦除:反向高电压把电子拉出来
- 读取:测沟道电流大小判断浮栅里有多少电荷
电荷陷阱(Charge Trap)NAND 用绝缘层代替浮栅,原理类似——3D NAND 主流是这个变种。
NAND 的”反人类”特性
NAND 和 DRAM/HDD 完全不同:
graph TB R[读:单 page
~50 μs] --> R1[页面 = 4-16 KB] W[写:单 page
~500 μs] --> W1[必须先擦除] E[擦除:整个 block
~5 ms] --> E1[block = 几百个 page
多 MB] E --> E2[擦写次数有限
SLC 10万 / TLC 3千]
关键事实:
- 读 < 写 < 擦 在时间上数量级递增
- 写入必须先擦除,但擦除粒度比写大得多
- 擦写有寿命——次数有限就报废
这就是为什么 SSD 需要复杂的控制器——下一篇专门讲。
SLC / MLC / TLC / QLC / PLC
通过控制浮栅里的电荷量,一个单元可以存多个 bit:
graph LR SLC[SLC
1 bit/cell
2 个状态] --> MLC[MLC
2 bit/cell
4 个状态] MLC --> TLC[TLC
3 bit/cell
8 个状态] TLC --> QLC[QLC
4 bit/cell
16 个状态] QLC --> PLC[PLC
5 bit/cell
32 个状态]
关键参数对比:
| SLC | MLC | TLC | QLC | PLC | |
|---|---|---|---|---|---|
| bit/cell | 1 | 2 | 3 | 4 | 5 |
| 电压级别 | 2 | 4 | 8 | 16 | 32 |
| 擦写次数 (P/E cycles) | 50K-100K | 10K | 1-3K | 300-1K | <300 |
| 读延迟 | 极快 | 快 | 中 | 慢 | 慢 |
| 写延迟 | 极快 | 中 | 慢 | 很慢 | 很慢 |
| 单 GB 价格 | 最贵 | 贵 | 甜点 | 便宜 | 最便宜 |
| 应用 | 缓存 / 工业 | 退场 | 主流 | 容量盘 | 实验阶段 |
bit 数翻倍 ≠ 容量翻倍,因为相邻电压间距越来越窄、ECC 越来越重,可用容量没全部利用。
现实情况:MLC 已经退场
2020 年后 MLC(2 bit/cell)几乎退出主流市场——TLC 在企业级也站稳了。当前情况:
1 | |
TLC 是 2026 年的甜点——每 GB 比 QLC 贵 30-50%,但寿命是 3-10 倍。
平面 NAND 的死亡 → 3D NAND 的兴起
2D 平面 NAND 的极限
早期 NAND 单元在芯片上平铺:
1 | |
工艺缩到 1Xnm(约 14-16 nm)后,相邻单元间的电荷干扰、隧穿氧化层退化让密度无法再提——2D NAND 在 2014 年左右撞墙。
3D NAND:把单元堆起来
1 | |
把单元做在垂直方向——横向工艺不用缩,密度靠堆层涨:
1 | |
3D NAND 是过去十年存储工艺最重要的演进——比工艺微缩更重要。
关键技术:CuA / String Stacking / Hybrid Bonding
随着层数越堆越多,几个工艺难点逐步出现:
CuA(CMOS-under-Array)
把外围电路(CMOS)放到 NAND 阵列下面,省芯片面积。
String Stacking
一次 etch 几百层很难——把 200 多层分成两组,先做 100 多层、再做另 100 多层对位接上。
Hybrid Bonding(混合键合)
把 CMOS 和 NAND 分别在不同 wafer 上做,再焊接在一起。各做各的最优工艺。长江存储(YMTC)的 X-Tacking 是这条路的代表。
待补充:YMTC X-Tacking 4 代当前进展。
NAND 颗粒供应商
NAND 是当前国产化推进相对成功的领域:
| 厂商 | 主要工艺 | 当前主流 | 国别 |
|---|---|---|---|
| Samsung | V-NAND | V8 232 层(2024) | 韩国 |
| SK海力士 / Solidigm | 4D / V7 | 232 层(合并 Solidigm 后) | 韩 / 美 |
| Kioxia / WD | BiCS | BiCS8 218 层 | 日 / 美 |
| Micron | Replacement Gate | G9 232 层 | 美 |
| YMTC(长江存储) | Xtacking | Xtacking 4.0 232 层 | 中 |
待补充:Solidigm(前 Intel NAND 业务卖给 SK 海力士子公司)、Kioxia/WD(合并/分离话题)的最新结构。
国内 YMTC 是少数能与国际同步层数的厂家——232 层 TLC 已规模量产。但受到出口管制影响,YMTC 在 2025-2026 年扩产受限。
NAND 颗粒上的”花样”
一颗 NAND die 不是简单”一堆 cell”,里面还有:
1 | |
多 plane 操作
现代 NAND 单 die 有 4-6 个 plane,可以并行读写——这是 SSD 控制器能堆出高 IOPS 的物理基础。
Open Block 问题
正在写入的 block 叫 “open block”。多个并发写如果落在同一 open block 上会互相影响——这是 SSD 多线程性能的考量点。
NAND 的可靠性问题
1. P/E Wear(擦写磨损)
每次擦除让隧穿氧化层退化一点。次数到达上限后,单元保电能力减弱。
2. Read Disturb(读干扰)
频繁读一行会”逐步擦”相邻行——很神奇但物理上确有影响。每读 N 次需要一次 refresh。
3. Data Retention(保电时间)
新写入的数据可以保 10 年,磨损到末期可能只能保几个月。断电存放 1 年的 SSD 数据可能丢失——这是不能用 SSD 替代磁带做长期归档的原因。
4. Program Disturb(写干扰)
写一个单元会影响相邻单元——尤其是 3D NAND 里同 String 上的相邻 cell。
应对:强 ECC + 后台 refresh + wear leveling,下一篇讲控制器时细说。
QLC 在企业级的崛起
QLC 写性能差、寿命短,按理不该上数据中心。但近 2 年 QLC 在企业市场份额快速增加:
理由:
- 冷数据 / 读多写少:对象存储、AI 训练数据集、CDN 边缘缓存——这些场景写入很少
- 超大容量:单盘 30-122 TB QLC SSD 已上市(Solidigm D5-P5336 是代表)
- 带宽 + IOPS 仍优于 HDD:即便是 QLC,也比 HDD 快百倍
graph LR HOT[热数据
OLTP / 高频读写] --> TLC[TLC SSD] WARM[温数据
分析 / 中频] --> TLC COLD[冷数据
归档 / 低频] --> QLC[QLC 大容量 SSD
or HDD] ARCHIVE[超冷数据
极少访问] --> HDD[HDD / 磁带]
QLC 正在接管”温-冷数据”层,把 HDD 边界向更冷的方向继续压。
一张总结
graph TB CELL[NAND 单元
浮栅或电荷陷阱] CELL --> SLC2[SLC 1bit] CELL --> MLC2[MLC 2bit] CELL --> TLC2[TLC 3bit] CELL --> QLC2[QLC 4bit] CELL --> PLC2[PLC 5bit] STR[3D NAND 结构] STR --> P1[Page 4-16KB 读写] STR --> P2[Block 多 MB 擦除] STR --> P3[Plane 并行] STR --> P4[Layer 232+ 堆叠]
小结
- NAND 单元用浮栅或电荷陷阱存电荷,断电不丢
- bit/cell 越多容量越大但写慢、寿命短:TLC 是企业级当前甜点
- 平面 NAND 在 14nm 撞墙,3D NAND 用堆层涨密度
- 当前 232 层是主流,长江存储跟上节奏
- NAND 有 P/E wear、read disturb、data retention 等可靠性问题
- QLC 在数据中心快速上量,吃 HDD 温/冷数据份额
下一篇讲 SSD 控制器和 FTL——把 NAND 的反人类特性藏起来的关键。