DDR 演进 —— 从 SDR 到 DDR5

上一篇讲了 DRAM 的物理基础,本篇按时间线梳理 DDR 标准的演进,重点看 DDR4 → DDR5 这一代——服务器内存当前的主战场。

从 SDR 到 DDR:一边沿到双边沿

最早的同步内存(SDRAM,简称 SDR)和系统时钟同步——每个时钟周期传 1 次数据

1
2
3
SDR:    ┌─┐ ┌─┐ ┌─┐
CLK ──┘ └─┘ └─┘ └── (上升沿)
DATA X1 X2 X3 1 次/周期

**DDR(Double Data Rate)**让上升沿和下降沿都传——同样的时钟,带宽翻倍

1
2
3
DDR:    ┌─┐ ┌─┐ ┌─┐
CLK ──┘ └─┘ └─┘ └──
DATA X1X2 X3X4 X5X6 2 次/周期

这就是 SDR → DDR 的本质。后续 DDR2/3/4/5 都是 DDR 的优化和提速版本,双边沿是不变的核心

DDR 五代速览

代次 量产年份 数据率 (MT/s) 工作电压 单条容量上限 预取 (n) Bank 数
DDR1 2000 200-400 2.5V 1 GB 2n 4
DDR2 2003 400-1066 1.8V 4 GB 4n 4-8
DDR3 2007 800-2133 1.5V 16 GB 8n 8
DDR4 2014 1600-3200(极限 4266) 1.2V 64 GB(3DS 256 GB) 8n 16(4 BG × 4)
DDR5 2021 4800-6400(极限 8800+) 1.1V 128 GB(3DS 512 GB) 16n 32(8 BG × 4)

注:DDR1 时期叫”DDR SDRAM”,没数字后缀;后来加上 DDR2 才追改叫 DDR1。

几个核心趋势

graph LR
  A[频率上去了] --> AA[带宽翻番]
  B[电压降下来] --> BB[功耗持平]
  C[预取加深] --> CC[内核频率不变也能涨频率]
  D[Bank 多了] --> DD[Bank 级并行]

预取是关键——DRAM 单元本身的速度二十年没怎么变。能往上推频率,主要是把”一次取多个 word 同时输出”的预取(prefetch)加深:DDR1 的 2n、DDR2 的 4n、DDR3/4 的 8n、DDR5 的 16n。

DDR4:服务器主流十年(2014-2024)

DDR4 发布后服务器市场用了整整十年。它的几个关键改进:

1. Bank Group(BG)

DDR4 把 16 个 Bank 分成 4 个 Bank Group × 4 Bank。同 BG 内访问有时序约束(tCCD_L),不同 BG 间访问更宽松(tCCD_S)——这让交错访问更高效。

2. 3DS(3D Stacking)

把多颗 DRAM die 堆叠在一颗封装里,用 TSV 互联。一颗封装的容量翻倍,单条 256 GB LRDIMM 就靠 3DS 实现。

3. ECC 强化

服务器 ECC RDIMM 在 DDR4 上是标配——后面专门讲。

4. 各厂家颗粒迭代

DDR4 有几代颗粒:

1
A-die → B-die → C-die → ... → M-die

三星、SK海力士、美光每隔 1-2 年推一代新颗粒,频率上限和功耗逐代优化。B-die 在玩家圈是”超频神器”,但服务器用通常不区分这些。

DDR5:2021 起的新世代

Intel 从 Sapphire Rapids(2023)开始全面切 DDR5,AMD 从 Zen 4 Genoa(2022)开始切。当前所有主流服务器 CPU 都已是 DDR5

DDR5 的关键变化

1. 通道拆分:1×64 → 2×32

DDR4 时一根 DIMM 是1 个 64 bit 通道。DDR5 把它拆成2 个独立 32 bit 子通道

1
2
3
4
5
6
DDR4:  [────── 64 bit ──────]
1 通道,1 个 burst 读 64B

DDR5: [─ 32b ─][─ 32b ─]
2 个独立子通道,各自 burst
总 burst = 2×64B

效果:一根条子上同时跑两个独立访问 → Bank 级并行翻倍。这是 DDR5 提升真实有效带宽的关键,不只是”频率涨了”。

2. PMIC(电源管理集成芯片)下沉到 DIMM

DDR4 时电源管理在主板上,DDR5 直接放到 DIMM 上。每条都有自己的 PMIC,电压稳定性更好——这是 DDR5 能上 1.1V 还稳的物理基础。

3. on-die ECC

DDR5 颗粒自带 ECC——颗粒内部的位翻转可以纠错(128 bit 数据 + 8 bit ECC,SEC)。这是为应对工艺缩到 1z/1α nm 之后位翻转率上升的内部纠错,和”系统级 ECC”是两回事

ECC 类型 工作位置 作用范围
on-die ECC DRAM 颗粒内部 颗粒内位翻转
side-band ECC DIMM + 内存控制器 通道传输位翻转、芯片故障
inline ECC 仅内存控制器(ECC 占用部分容量) 低成本场景

服务器 RDIMM 通常 on-die + side-band 都有,两层防护。

4. SPD/RCD/PMIC 变 5 颗

服务器级 RDIMM/MRDIMM 上 IC 多了:

1
2
3
4
5
6
DDR5 RDIMM:
- 几十颗 DRAM 颗粒
- 1 颗 RCD(注册时钟驱动)
- 1 颗 SPD Hub
- 1-2 颗 PMIC
- 1 颗温度传感器

5. Bank 数翻倍

8 BG × 4 Bank = 32 Bank——给乱序访问更多并行机会。

DDR5 数据率路线图

代次 标称数据率 量产时间
DDR5-4800 4800 MT/s 2021
DDR5-5600 5600 MT/s 2022-2023
DDR5-6400 6400 MT/s 2024
DDR5-8000+ 8000 MT/s+ 2025(HEDT 已上,服务器在跟进)

待补充:服务器 RDIMM 在 8000+ MT/s 上的稳定量产时间。HEDT 平台(Threadripper / Xeon W)已可上 8000,服务器 RDIMM 因稳定性要求有滞后。

为什么内存通道数比频率更影响实际带宽

CPU 总带宽 = 通道数 × 单通道频率 × 8 字节。

平台 通道数 数据率 带宽
Intel Xeon Skylake-SP 6 DDR4-2666 128 GB/s
Intel Xeon SPR/EMR 8 DDR5-4800 307 GB/s
Intel Xeon 6 P 12 DDR5-6400 614 GB/s
AMD EPYC Genoa 12 DDR5-4800 460 GB/s
AMD EPYC Turin 12 DDR5-6000 576 GB/s
NVIDIA Grace LPDDR5X-8533 (等效 16 通道) >500 GB/s

Xeon 6 的 12 通道 + DDR5-6400 是当前 x86 服务器的天花板。

DIMM 插槽配置的”坑”

很多人买了 12 通道平台只插 8 条 → 实际只能跑 8 通道,带宽损失 33%

1
2
3
4
12 通道 CPU:
✗ 插 6 条 → 6 通道 = 50% 带宽
✗ 插 8 条 → 8 通道 = 67% 带宽
✓ 插 12 条 → 12 通道 = 100% 带宽

DDR5 服务器一般规则:满通道 + 每通道一根(1DPC)跑标频。要 2DPC(每通道两根条)频率会自动降一档——内存控制器扛不住信号完整性。

配置 DDR5 频率上限
1DPC(每通道 1 条) DDR5-6400 / 5600
2DPC(每通道 2 条) DDR5-4800 / 4400

待补充:DDR5 MRDIMM 在 2DPC 下能否突破这个限制。

MRDIMM(Multiplexed Rank DIMM)

DDR5 时代新引入的高带宽规格——JEDEC 在 2024 年通过的标准

  • 在 RDIMM 基础上加一颗 MUX 芯片,把两个 Rank 合并到 burst 上
  • 数据率从 6400 翻倍到 8800 / 12800 MT/s
  • 同样基于普通 DDR5 颗粒,对 CPU 是兼容的
1
2
普通 DDR5 RDIMM:6400 MT/s × 1 Rank → 6400 有效
MRDIMM: 6400 MT/s × 2 Rank merged → 12800 有效

Intel Xeon 6 P 第一个支持 MRDIMM 的服务器平台。AMD Turin 待补充支持时间。

待补充:MRDIMM 的实际上市价格和供货情况。

DDR6:在路上

JEDEC 已开始 DDR6 标准制定,路线图大致:

  • 数据率 8800 起,目标 17600+ MT/s
  • 通道继续拆分,每通道更窄、更多
  • 量产预计 2027-2028

这个时间节点服务器市场会经历”DDR5 / MRDIMM / CXL 内存”并存的过渡期。

一张总结

graph TB
  SDR[SDR
1996
100-133 MT/s] --> D1[DDR1
2000
200-400] D1 --> D2[DDR2
2003
400-1066] D2 --> D3[DDR3
2007
800-2133] D3 --> D4[DDR4
2014
1600-3200] D4 --> D5[DDR5
2021
4800-8800] D5 --> MR[MRDIMM
2024
8800-12800] D5 -.-> D6[DDR6
2027+]

小结

  • DDR 的核心是双边沿——后续每代都是把这个机制加预取、加 Bank、加宽
  • DDR5 最重要的不是频率高,而是子通道拆分带来的并行翻倍
  • on-die ECC 是 DDR5 的工艺补救——不能替代系统 ECC
  • 实际带宽 = 通道数 × 频率,通道数往往比频率更重要
  • MRDIMM 是 DDR5 时代的”加速版”,DDR6 还要再等 1-2 年

下一篇讲内存条形态——UDIMM/RDIMM/LRDIMM/MRDIMM 到底有什么区别。