服务器分类 —— 从外形到负载的多维划分
“机架式 2U 双路 x86 通用服务器”——这是采购单上最常见的一行字。看似简单的描述里,其实嵌入了外形、路数、指令集、负载等多个维度的分类。本文把这套分类体系讲清楚。
五个分类维度
graph TB S[服务器] S --> F[按外形] S --> P[按 CPU 路数] S --> I[按指令集] S --> L[按负载类型] S --> N[按场景/产品形态] F --> F1[塔式 / 机架 / 刀片 / 高密 / 整机柜] P --> P1[单路 / 双路 / 四路 / 八路] I --> I1[CISC X86 / RISC ARM·POWER·MIPS / VLIW] L --> L1[Web / DB / 文件 / 应用 / HPC] N --> N1[通用 / 云 / 边缘 / AI]
按外形(Form Factor)
这是最直观的一种分法,决定了服务器在机房怎么摆、怎么散热、怎么布线。
1. 塔式(Tower)
外形像台式机,立式或卧式,部门级 / 小企业 / 分支机构 常见。
- 优点:单台部署灵活,不需要机柜
- 缺点:占地大、密度极低、不便于集中运维
2. 机架式(Rack)
机柜里横向插入的”刀块”,按高度算 1U / 2U / 4U / 8U(1U = 1.75 英寸 = 44.45mm)。数据中心绝对主流。
- 1U:薄、密度高,但风道紧、CPU TDP 受限、PCIe 槽少
- 2U:当前最主流,平衡了密度、扩展性和散热——双路、24 盘位、PCIe 5.0 多槽都能容纳
- 4U+:用于多 GPU 服务器(如 8 卡 H100)、大容量存储、特殊扩展
3. 刀片(Blade)
一个刀片机箱(通常 6U–10U)内插多个”刀片节点”,共用电源、风扇、管理模块、交换背板。
- 优点:极致密度、统一管理、布线简单
- 缺点:被一个厂商的机箱锁定(HPE、Dell、华为各家不通用)、单刀片扩展能力受限
- 应用:传统企业 IT、虚拟化资源池
近年来刀片在公有云时代的份额已被整机柜侵蚀。
4. 高密(Multi-node / High Density)
在 2U 机箱里塞 4 个独立计算节点(俗称”2U 4 节点”),共用电源和风扇。代表:Dell C-series、HPE Apollo、Supermicro BigTwin、Inspur i48 等。
- 优点:CPU 密度比普通 2U 高 4 倍
- 应用:HPC、Hadoop、Web 前端等”水平扩展型”工作负载
5. 整机柜(Rack-Scale)
一整个机柜出厂前已经把节点、电源、网络、液冷管路都装好,运到机房通电即用。代表:
- OCP(Open Compute Project):Facebook 主导,开源规范
- 天蝎计划:阿里、腾讯、百度主导的国内整机柜规范
- NVIDIA GB200 NVL72:72 颗 GPU、36 颗 Grace CPU,铜缆 NVLink 互联,成为当前 AI 训练机柜标杆
第 8 篇会专门讲整机柜。
按 CPU 路数(Socket Count)
| 路数 | 典型场景 | 代表 CPU |
|---|---|---|
| 单路(1P) | 中小企业、边缘、轻量负载 | Xeon 6 单路、EPYC 单路 |
| 双路(2P) | 数据中心绝对主流 | Xeon 6 / EPYC 9005 |
| 四路(4P) | 大型数据库、SAP HANA、虚拟化资源池 | Xeon 6 8000 系列、EPYC 9005 |
| 八路(8P) | 极少数关键业务、Mainframe 替代 | Xeon 8000 顶配 |
注:CPU 路数 ≠ 性能线性叠加。多路之间通过 UPI/IF 互联,跨 CPU 的内存访问(远程 NUMA)有显著延迟,不是所有应用都能从 4P/8P 受益。一般来说 90% 以上的 x86 服务器是双路。
按指令集架构
最重要的两类是 CISC 和 RISC,加上一个特殊的 VLIW。
CISC(复杂指令集)—— 以 x86 为代表
- 指令多、长度可变、寻址方式多
- 用微码(microcode)实现复杂指令
- 代表:Intel x86、AMD x86-64
- 占据服务器市场 90%+ 份额
RISC(精简指令集)
- 指令少、定长、易于流水线和并行
- 大部分指令在一个周期内完成
- 代表:
- ARM:服务器市场快速增长(AWS Graviton、NVIDIA Grace、Ampere AmpereOne、华为鲲鹏)
- POWER:IBM 大型机/小型机
- MIPS:嵌入式为主,龙芯曾基于 MIPS(已转 LoongArch)
- SPARC:Oracle/Sun,已边缘化
- RISC-V:开源指令集,2020 年后快速崛起
VLIW
- 一条超长指令字内并行编排多条操作
- 代表:Intel Itanium(IA-64,已停产)、TI DSP、华为昇腾 NPU 内部
- 通用服务器领域已基本退场
CISC vs RISC:还重要吗?
学界有个共识:现代 x86 处理器内部其实是 RISC——译码器把 CISC 指令翻译成微操作(μops),后端是 RISC 风格的乱序执行。所以”CISC vs RISC”在 2026 年更多是生态和兼容性的差异,不是性能的本质差异:
- x86:Windows、Linux、商业软件生态最完整
- ARM:移动起家,服务器侧近年靠云原生 + AI 推理快速突破
- RISC-V:开源,长尾市场和定制 SoC 大量采用
第 2 章会专题展开。
按负载类型
按”这台服务器主要拿来跑什么”,可以分:
- 数据库服务器:高内存容量、高内存带宽、高 IOPS
- 应用服务器:均衡型,CPU 性能优先
- Web 服务器:高并发连接、网络带宽优先
- 文件服务器 / 存储服务器:盘位多、网络带宽优先、CPU 适中
- HPC 计算服务器:高浮点吞吐、低延迟互联(IB/RoCE)
- AI 训练服务器:多 GPU + HBM + NVLink + 高速网络
- AI 推理服务器:单 GPU 或低成本加速卡 + 大内存
注意这些分类不是硬件型号,而是”配置侧重点”——同一款主板,可以根据装的内存/盘/卡变成不同负载的服务器。
AI 服务器:值得单独说
AI 服务器是过去五年增长最快的品类,从硬件构成上和通用服务器有显著差异:
graph LR
subgraph 通用["通用服务器"]
G1[2x CPU
大头]
G2[24x DIMM]
G3[24x SSD]
G4[2x NIC]
end
subgraph AI["AI 服务器"]
A1[2x CPU]
A2[24x DIMM]
A3[8x GPU
大头]
A4[8x DPU/高速 NIC]
A5[NVLink/NVSwitch]
A6[HBM 显存]
A7[液冷/风液混合]
end
AI 服务器和通用服务器的核心差异:
| 维度 | 通用服务器 | AI 服务器(训练) |
|---|---|---|
| 算力来源 | CPU 为主 | GPU/加速卡为主(CPU 仅做调度) |
| 显存 | 无(纯系统内存) | HBM2e/HBM3/HBM3e |
| 节点内互联 | PCIe 即可 | NVLink/NVSwitch 必备 |
| 节点间互联 | 25/100G | 400G/800G + RoCE/IB |
| 单机功耗 | 1–2 kW | 5–15 kW(8 卡 H100 整机已破 10kW) |
| 散热 | 风冷主流 | 液冷为主(冷板/浸没) |
| 形态 | 1U/2U | 4U/6U/8U 或整机柜 |
按用途细分,AI 服务器又分训练和推理:
- 训练:典型 8 GPU + NVSwitch 全互联,对带宽、显存、功耗都极致
- 推理:可以是 1–8 GPU,也可用 NPU/FPGA/PCIe 加速卡,看延迟和吞吐要求
第 5 章 GPU 部分详细展开。
边缘服务器
数据中心之外,”靠近数据产生地”的服务器,称为边缘服务器(Edge Server)。
特点:
- 物理体积小,1U/2U 短深度(450–600mm,对比标准机架 750–1000mm)
- 工作温度范围宽(-5–55°C),抗振、防尘
- 可能带 GPU/NPU 做就地推理
- 部署位置:通信机房、工厂、店铺、车站、基站旁边
应用场景:CDN 节点、智能制造、视频分析、车路协同、5G UPF。
一张总表
| 维度 | 选项 | 典型选择 |
|---|---|---|
| 外形 | 塔/机架/刀片/高密/整机柜 | 数据中心:2U 机架 / AI:4U+ 或整机柜 |
| 路数 | 1P/2P/4P/8P | 主流 2P |
| 指令集 | x86/ARM/RISC-V/POWER | x86 主流,ARM 上升 |
| 负载 | 通用/数据库/Web/HPC/AI | 按业务定 |
| 场景 | 通用/云/边缘/AI | 决定外形和功耗 |
下一篇讲一个越来越重要的话题——散热。当 8 卡 GPU 服务器单机超过 10 kW,传统风冷已经压不住了。
小结
- 五个维度可以独立组合,比如”机架 2U + 双路 + x86 + AI 推理 + 边缘”
- 主流出货:双路 x86 机架(通用) + 4U/8U 多 GPU(AI 训练) + 1U 短深度(边缘)
- AI 服务器不是简单”加几张 GPU 的通用服务器”,是从供电、散热、互联、形态全面重构的新物种