如何配置一台深度学习工作站?

OXIDA · 发表于 2025-7-25 15:42:25

这篇文章主要介绍的是家用的深度学习工作站，典型的配置有两种，分别是一个 GPU 的机器和四个 GPU的机器。如果需要更多的 GPU 可以考虑配置两台四个 GPU 的机器。如果希望一台机器同时具备 8~10 个 GPU 需要联系专门的供应商进行配置，并且需要专业的机房存放这些服务器，放在家里噪声很大并且容易跳闸。

CPU

由于最近 AMD 和 Intel 频繁更新 CPU，因此大家选择新款的 CPU 比较好。

CPU 与 GPU 的关系

CPU 瓶颈没有那么大，一般以一个 GPU 对应 2~4 个 CPU 核比较好，比如单卡机器买四核 CPU，四卡机器买十核 CPU。

当你在训练的时候，只要数据生成器（DataLoader）的产出速度比 GPU 的消耗速度快，那么 CPU 就不会成为瓶颈，也就不会拖慢训练速度。

PCI-E 支持情况

除了核数，你还需要注意 PCI-E 支持情况，一般显卡是 PCI-E 4.0 x16，比如 i9-10900X 的 PCI-E 通道数是 48 ，配置四卡的话，只能支持 1x16+3x8，也就是单卡全速，三卡半速。这种情况下可以考虑选择带有 PLX 桥接芯片的主板，比如 Pro WS X299 SAGE II。

英特尔CPU

英特尔 CPU 天梯图如下：

[/url]

如果本文已经过时，你可以搜索关键字【CPU 天梯图】查找最新的 CPU 信息。

单卡根据预算选择合适的 CPU，双卡机器建议选 i9-10900 系列，四卡机器按照预算选 [url=https://www.intel.cn/content/www/cn/zh/products/details/processors/core/x.html]X系列的 CPU。（注意，X 系列最新发布的 CPU 是 2019 年的，已经不建议使用）

主板

主板需要注意：

CPU 接口是否能对上，如 LGA1700 与 LGA206
PCI-E 插槽的高度是否够插显卡，比如 PCI-E 插口之间的距离至少要满足双槽宽显卡的高度
PCI-E 同时可以支持几张卡以什么样的速度运行，如 1x16 + 3x8 是常见的配置

主板必看参数

GIGABYTE X299 AORUS MASTER (rev. 1.0) 使用了 4 组 2 槽间距显卡插槽设计，支持 1x16、2x16、2x16 + 1x8、1x16 + 3x8 四种配置（需要十核以上的 CPU），这里请参阅说明书安装显卡，安装在不同位置的速度是不一样的：

[/url]

[url=https://dl.ypw.io/how-to-build-deep-learning-workstation/pcie.png]

带有桥接芯片的主板

有的主板如 Pro WS X299 SAGE II 带有 PLX 桥接芯片，可以在 CPU 没有足够 PCI-E 的情况下达到四卡 x16 的速度：

[/url]

[url=https://dl.ypw.io/how-to-build-deep-learning-workstation/pcie2.png]

在多卡并行训练的时候，PCI-E 的传输速度决定了梯度同步的速度，如果你训练的的模型比较大，希望搭建多卡机器，建议选择支持四路 PCI-E x16 的主板。

显卡显卡性能表[td]

型号	价格（元）	显存（GB）	性能（TFLOPS）	厚度（槽宽）
3090	12,799	24	328	3
3080Ti	8,999	12	320	3
3080	6,499	10	280	3
3070Ti	5,199	16	184	3
3070	4,599	8	162	3
3060	3,599	12	112	3
3050	2,499	8	80	3
3090涡轮	15,399	24	328	2
3080Ti涡轮	10,399	12	320	2
3080涡轮	7,899	10	280	2
3070Ti涡轮	6,799	16	184	2
3060涡轮	3,899	12	112	2
A2000	3,300	12	64	1
A4000	6,000	16	153	1
A4500	11,000	20	189	2
A5000	14,500	24	222	2
A6000	26,800	48	310	2
T4	10,500	16	65	1

[/url]

训练需要 FP32 和 FP16 的性能，推断需要 INT8 的性能。训练大模型需要注意显存大小。

考虑性价比可以买 RTX 3080Ti，想要大显存比可以买 RTX 3090。

值得注意的是，官方公布的参数并不一定是最终性能，实测 A6000 是比 3090 快的：

[url=https://dl.ypw.io/how-to-build-deep-learning-workstation/gpu2.png]

参考链接：

涡轮与风扇

采购显卡的时候，一定要注意买涡轮版的，不要买两个或者三个风扇的版本，除非你只打算买一张卡。

因为涡轮风扇的热是往外机箱外部吹的，所以可以很好地带走热量，散热比较好。如果买三个风扇的版本，插多卡的时候，上面的卡会把热量吹向第二张卡，导致第二张卡温度过高，影响性能。

风扇显卡很有可能是超过双槽宽的，第二张卡可能插不上第二个 PCI-E 插槽，这个也需要注意。

[/url]

涡轮：[url=https://www.zotac.com/cn/product/graphics_card/%E7%B4%A2%E6%B3%B0-geforce%C2%AE-rtx2080-8gd6-ai%E7%89%88-oc-ha]索泰 GeForce® RTX2080-8GD6 AI版 OC HA

[/url]

风扇：[url=https://rog.asus.com.cn/graphics-cards/graphics-cards/rog-strix/rog-strix-rtx2080ti-o11g-gaming-model/]华硕 ROG 猛禽系列 GeForce RTX™ 2080 Ti OC版

硬盘硬盘类型

常用硬盘接口有三种：

SATA3.0，速度 600MB/s
SAS，速度 1200MB/s
PCIE 3.0 x4（NVMe），速度 3.93GB/s
PCIE 4.0 x4（NVMe），速度 7.87GB/s

参数对比

下面是根据代表产品查询的参数：

[td]

类型	价格(元/TB)	读取速度(MB/s)	写入速度	4K随机读取(IOPS)	4K随机写入(IOPS)
SATA3 机械硬盘	150	270	258	170	550
SATA3 固态硬盘	700	560	530	98000	88000
NVMe 固态硬盘	800	3500	3000	500000	480000