共计 72 篇文章
2025
RDMA 深入 —— InfiniBand、RoCE 与 iWARP
智能网卡与 DPU —— 网卡上的"小服务器"
网卡演进 —— 从千兆到 800G
GPU 选型实战与第五章小结
AI 集群网络 —— InfiniBand、RoCE 与万卡训练
AI 训练 vs 推理 —— 硬件视角的根本差异
国产 AI 芯片 —— 昇腾、寒武纪、摩尔线程等
Intel Gaudi、Google TPU 与其他 AI 加速器
AMD Instinct —— NVIDIA 之外的"另一颗 AI GPU"
NVLink、NVSwitch 与 NVL72 —— 多卡变成"一颗大 GPU"
NVIDIA 数据中心 GPU 路线 —— V100 到 Rubin
GPU 历史 —— 从图形到通用计算
存储选型实战与第四章小结
分布式存储入门 —— Ceph / HDFS / 对象存储
RAID 与企业级存储 —— 从单盘到存储阵列
企业级 SSD vs 消费级 —— 不只是贵 10 倍
存储接口演进 —— SATA / SAS / NVMe 与 EDSFF
SSD 控制器与 FTL —— 把 NAND 变得"像硬盘"
NAND 闪存基础 —— SLC / MLC / TLC / QLC 与 3D NAND
HDD 物理基础与企业级机械盘
服务器内存选型实战与第三章小结
CXL —— 内存解耦的关键拼图
HBM —— AI 时代的高带宽内存
持久内存的兴衰 —— NVDIMM 与 Optane 的故事
ECC 与内存可靠性 —— Parity / SECDED / Chipkill