服务器分类 —— 从外形到负载的多维划分

“机架式 2U 双路 x86 通用服务器”——这是采购单上最常见的一行字。看似简单的描述里,其实嵌入了外形、路数、指令集、负载等多个维度的分类。本文把这套分类体系讲清楚。

五个分类维度

graph TB
  S[服务器]
  S --> F[按外形]
  S --> P[按 CPU 路数]
  S --> I[按指令集]
  S --> L[按负载类型]
  S --> N[按场景/产品形态]
  F --> F1[塔式 / 机架 / 刀片 / 高密 / 整机柜]
  P --> P1[单路 / 双路 / 四路 / 八路]
  I --> I1[CISC X86 / RISC ARM·POWER·MIPS / VLIW]
  L --> L1[Web / DB / 文件 / 应用 / HPC]
  N --> N1[通用 / 云 / 边缘 / AI]

按外形(Form Factor)

这是最直观的一种分法,决定了服务器在机房怎么摆、怎么散热、怎么布线。

1. 塔式(Tower)

外形像台式机,立式或卧式,部门级 / 小企业 / 分支机构 常见。

  • 优点:单台部署灵活,不需要机柜
  • 缺点:占地大、密度极低、不便于集中运维

2. 机架式(Rack)

机柜里横向插入的”刀块”,按高度算 1U / 2U / 4U / 8U(1U = 1.75 英寸 = 44.45mm)。数据中心绝对主流

  • 1U:薄、密度高,但风道紧、CPU TDP 受限、PCIe 槽少
  • 2U:当前最主流,平衡了密度、扩展性和散热——双路、24 盘位、PCIe 5.0 多槽都能容纳
  • 4U+:用于多 GPU 服务器(如 8 卡 H100)、大容量存储、特殊扩展

3. 刀片(Blade)

一个刀片机箱(通常 6U–10U)内插多个”刀片节点”,共用电源、风扇、管理模块、交换背板。

  • 优点:极致密度、统一管理、布线简单
  • 缺点:被一个厂商的机箱锁定(HPE、Dell、华为各家不通用)、单刀片扩展能力受限
  • 应用:传统企业 IT、虚拟化资源池

近年来刀片在公有云时代的份额已被整机柜侵蚀。

4. 高密(Multi-node / High Density)

在 2U 机箱里塞 4 个独立计算节点(俗称”2U 4 节点”),共用电源和风扇。代表:Dell C-series、HPE Apollo、Supermicro BigTwin、Inspur i48 等。

  • 优点:CPU 密度比普通 2U 高 4 倍
  • 应用:HPC、Hadoop、Web 前端等”水平扩展型”工作负载

5. 整机柜(Rack-Scale)

一整个机柜出厂前已经把节点、电源、网络、液冷管路都装好,运到机房通电即用。代表:

  • OCP(Open Compute Project):Facebook 主导,开源规范
  • 天蝎计划:阿里、腾讯、百度主导的国内整机柜规范
  • NVIDIA GB200 NVL72:72 颗 GPU、36 颗 Grace CPU,铜缆 NVLink 互联,成为当前 AI 训练机柜标杆

第 8 篇会专门讲整机柜。

按 CPU 路数(Socket Count)

路数 典型场景 代表 CPU
单路(1P) 中小企业、边缘、轻量负载 Xeon 6 单路、EPYC 单路
双路(2P) 数据中心绝对主流 Xeon 6 / EPYC 9005
四路(4P) 大型数据库、SAP HANA、虚拟化资源池 Xeon 6 8000 系列、EPYC 9005
八路(8P) 极少数关键业务、Mainframe 替代 Xeon 8000 顶配

注:CPU 路数 ≠ 性能线性叠加。多路之间通过 UPI/IF 互联,跨 CPU 的内存访问(远程 NUMA)有显著延迟,不是所有应用都能从 4P/8P 受益。一般来说 90% 以上的 x86 服务器是双路。

按指令集架构

最重要的两类是 CISC 和 RISC,加上一个特殊的 VLIW。

CISC(复杂指令集)—— 以 x86 为代表

  • 指令多、长度可变、寻址方式多
  • 用微码(microcode)实现复杂指令
  • 代表:Intel x86、AMD x86-64
  • 占据服务器市场 90%+ 份额

RISC(精简指令集)

  • 指令少、定长、易于流水线和并行
  • 大部分指令在一个周期内完成
  • 代表:
    • ARM:服务器市场快速增长(AWS Graviton、NVIDIA Grace、Ampere AmpereOne、华为鲲鹏)
    • POWER:IBM 大型机/小型机
    • MIPS:嵌入式为主,龙芯曾基于 MIPS(已转 LoongArch)
    • SPARC:Oracle/Sun,已边缘化
    • RISC-V:开源指令集,2020 年后快速崛起

VLIW

  • 一条超长指令字内并行编排多条操作
  • 代表:Intel Itanium(IA-64,已停产)、TI DSP、华为昇腾 NPU 内部
  • 通用服务器领域已基本退场

CISC vs RISC:还重要吗?

学界有个共识:现代 x86 处理器内部其实是 RISC——译码器把 CISC 指令翻译成微操作(μops),后端是 RISC 风格的乱序执行。所以”CISC vs RISC”在 2026 年更多是生态和兼容性的差异,不是性能的本质差异:

  • x86:Windows、Linux、商业软件生态最完整
  • ARM:移动起家,服务器侧近年靠云原生 + AI 推理快速突破
  • RISC-V:开源,长尾市场和定制 SoC 大量采用

第 2 章会专题展开。

按负载类型

按”这台服务器主要拿来跑什么”,可以分:

  • 数据库服务器:高内存容量、高内存带宽、高 IOPS
  • 应用服务器:均衡型,CPU 性能优先
  • Web 服务器:高并发连接、网络带宽优先
  • 文件服务器 / 存储服务器:盘位多、网络带宽优先、CPU 适中
  • HPC 计算服务器:高浮点吞吐、低延迟互联(IB/RoCE)
  • AI 训练服务器:多 GPU + HBM + NVLink + 高速网络
  • AI 推理服务器:单 GPU 或低成本加速卡 + 大内存

注意这些分类不是硬件型号,而是”配置侧重点”——同一款主板,可以根据装的内存/盘/卡变成不同负载的服务器。

AI 服务器:值得单独说

AI 服务器是过去五年增长最快的品类,从硬件构成上和通用服务器有显著差异:

graph LR
  subgraph 通用["通用服务器"]
    G1[2x CPU
大头] G2[24x DIMM] G3[24x SSD] G4[2x NIC] end subgraph AI["AI 服务器"] A1[2x CPU] A2[24x DIMM] A3[8x GPU
大头] A4[8x DPU/高速 NIC] A5[NVLink/NVSwitch] A6[HBM 显存] A7[液冷/风液混合] end

AI 服务器和通用服务器的核心差异

维度 通用服务器 AI 服务器(训练)
算力来源 CPU 为主 GPU/加速卡为主(CPU 仅做调度)
显存 无(纯系统内存) HBM2e/HBM3/HBM3e
节点内互联 PCIe 即可 NVLink/NVSwitch 必备
节点间互联 25/100G 400G/800G + RoCE/IB
单机功耗 1–2 kW 5–15 kW(8 卡 H100 整机已破 10kW)
散热 风冷主流 液冷为主(冷板/浸没)
形态 1U/2U 4U/6U/8U 或整机柜

按用途细分,AI 服务器又分训练推理

  • 训练:典型 8 GPU + NVSwitch 全互联,对带宽、显存、功耗都极致
  • 推理:可以是 1–8 GPU,也可用 NPU/FPGA/PCIe 加速卡,看延迟和吞吐要求

第 5 章 GPU 部分详细展开。

边缘服务器

数据中心之外,”靠近数据产生地”的服务器,称为边缘服务器(Edge Server)。

特点:

  • 物理体积小,1U/2U 短深度(450–600mm,对比标准机架 750–1000mm)
  • 工作温度范围宽(-5–55°C),抗振、防尘
  • 可能带 GPU/NPU 做就地推理
  • 部署位置:通信机房、工厂、店铺、车站、基站旁边

应用场景:CDN 节点、智能制造、视频分析、车路协同、5G UPF。

一张总表

维度 选项 典型选择
外形 塔/机架/刀片/高密/整机柜 数据中心:2U 机架 / AI:4U+ 或整机柜
路数 1P/2P/4P/8P 主流 2P
指令集 x86/ARM/RISC-V/POWER x86 主流,ARM 上升
负载 通用/数据库/Web/HPC/AI 按业务定
场景 通用/云/边缘/AI 决定外形和功耗

下一篇讲一个越来越重要的话题——散热。当 8 卡 GPU 服务器单机超过 10 kW,传统风冷已经压不住了。

小结

  • 五个维度可以独立组合,比如”机架 2U + 双路 + x86 + AI 推理 + 边缘”
  • 主流出货:双路 x86 机架(通用) + 4U/8U 多 GPU(AI 训练) + 1U 短深度(边缘)
  • AI 服务器不是简单”加几张 GPU 的通用服务器”,是从供电、散热、互联、形态全面重构的新物种