支持6块RTX3090静音级深度学习工作站硬件配置方案

nvidia的 Ampere架构-RTX 3090上市,该卡是第一个拥有超1万个流处理器的最强算力GPU卡,由于该卡外形尺寸巨大,长度达313mm,厚度3个槽,另外功耗到350w,常规GPU计算机/工作站最多支持1~2块,市场上是否有支持更多RTX3090的硬件配置?
西安坤隆公司的UltraLAB GX630M深度学习工作站可支持到最大6块RTX3090卡或7块RTX3070,用于深度学习训练和推理,该配置的深度学习工作站的张量计算单元(Tensor Core)FP16性能达到1.7PTflops(理论上),这是目前最快的。

(一)UltraLAB深度学习工作站支持RTX30情况

No

机型

关键配置

备注

1

GX380i

/GX390i

intel第9/10代高频

(8核@5Ghz-10核5.2GHz)

最大2块RTX30系列,

内存最大128GB

静音级

2块RTX3090性能超4块Titan RTX,

2块RTX3080性能超4块RTX2080ti

2

GT410P

intel第10代至尊处理器

(10核4.6GHz-18核4.2GHz),

内存最大256GB

最大5块RTX30系列,

20个硬盘位

静音级

4块RTX3080性能超7块Titan RTX和8块2080Ti

3

GX630M

2颗Xeon(最大56核)

最大6-7块RTX30系列

20个硬盘位

静音级

是目前具有最高GPU算力的工作站


UltraLAB深度学习工作站-GPU配备规格

下表是UltraLAB深度学习机型可供配置组合(按最高性能指标降序)

No

型号

卡数

CUDA核数

FP32单精度

TensorCore FP16半精度

显存带宽GBs

显存合计

应用推荐


Tesla V100

16块

81920

238Tflops

1760Tflops

653

512GB

CNN+RNN

1 RTX3090

6块

62976 213Tflops 1710Tflops 936 114GB CNN+RNN

2

RTX3080

6块

52224

179Tflops

1428Tflops

760

60GB

CNN

3

RTX3090

5块

52480

178Tflops

1425Tflops

936

120GB

RNN

4

RTX3080

5块

43520

149Tflops

1190Tflops

760

50GB

CNN

5

RTX3090

4块

41984

142Tflops

1140Tflops

936

96GB

RNN

6

RTX2080Ti

9块

39168

126Tflops

990Tflops

616

99GB

CNN

7

RTX3070

6块

35328

122Tflops

978Tflops

448

48GB

CNN

8

RTX3080

4块

34816

119Tflops

952Tflops

760

40GB

CNN

9

Titan RTX

7块

32256

114Tflops

910Tflops

672

168GB

CNN+RNN

10

RTX2080Ti

8块

34816

112Tflops

880Tflops

616

88GB

CNN

11

RTX3090

3块

41984

107Tflops

855Tflops

936

72GB

RNN

12

RTX3070

5块

29440

102Tflops

815Tflops

448

40GB

CNN

13

RTX3080

3块

34816

89Tflops

714Tflops

760

40GB

CNN

14

RTX3070

4块

23552

81Tflops

652Tflops

448

32GB

CNN

15

RTX3090

2块

20992

71Tflops

570Tflops

936

48GB

RNN

16

Titan RTX

4块

18432

65Tflops

520Tflops

672

96GB

CNN+RNN

17

RTX3070

3块

23552

61Tflops

489Tflops

448

24GB

CNN

18

RTX3080

2块

17408

60Tflops

476Tflops

760

20GB

CNN

19

RTX2080Ti

4块

17408

56Tflops

440Tflops

616

44GB

CNN

20

RTX2080s

4块

12288

44Tflops

252Tflops

496

32GB

CNN

21

RTX3070

2块

11776

41Tflops

326Tflops

448

16GB

CNN

22

RTX3090

1块

10496

36Tflops

285Tflops

936

24GB

RNN

23

Titan RTX

2块

9216

32Tflops

260Tflops

672

48GB

CNN+RNN

24

RTX2080Ti

2块

8704

28Tflops

220Tflops

616

22GB

CNN

25

RTX3080

1块

8704

30Tflops

238Tflops

760

10GB

CNN

26

RTX3070

1块

5888

20Tflops

163Tflops

448

8GB

CNN

27

Titan RTX

1块

4608

16Tflops

130Tflops

672

24GB

CNN+RNN

28

RTX2080Ti

1块

4352

14Tflops

110Tflops

616

11GB

CNN

29

RTX2080s

1块

3072

11Tflops

63Tflops

496

8GB

CNN

从上述表格看:

(1) UltraLAB 最高配置已经接近nvidia DGX-2性能

(2) 5块RTX3080性能超9块RTX2080Ti或7块Titan RTX

(3)3块RTX3080性能超4块Titan RTX

(二)UltraLAB 深度学习工作站配置方案2020v4

2.1 图灵超算工作站GX380i配置方案-科研型

深度学习1.jpg

o

产品型号

主要配置

显存

CUDA处理器FP16性能指标

单位:Tflops

张量处理器FP16性能指标

单位:Tflops

理想算法

价格

1.1

UltraLAB GX380i 14932-SAX

intel第9代处理器(6核@4.9Ghz) /32GB DDR4/RTX3080 10GB/960GB SSD /4TB SATA/双塔式(2000w) /23"图显

10GB

30

238

CNNRNN

¥29,800

1.2

UltraLAB GX380i 14932-SBT

intel第9代处理器(8核@4.9Ghz) /32GB DDR4/

RTX3090 24GB/1.9TB SSD /8TB SATA/双塔式(2000w) /23"图显

24GB

36

285

CNNRNN

¥49,990

1.3

UltraLAB GX380i 14932-SA2X

intel第9代处理器(8核@4.9Ghz ) /32GB DDR4 /2*RTX3070/1.9TB SSD /6TB SATA/双塔式(2000w)/23"图显

16GB

41

326

CNN

¥39,990

1.4

UltraLAB GX390i 15064-SB2X

intel第10代处理器(10核@5.0Ghz) /64GB DDR4 /2*RTX3080/1.9TB SSD /6TB SATA/双塔式(2000w)/23"图显

20GB

60

476

CNN

¥53,500

1.5

UltraLAB GX390i 15096-SC2T

intel第10代处理器(10核5.0Ghz) /96GB DDR4 /2*RTX3090/3.84TB SSD /8TB SATA/双塔式(2000w)/23"图显

48GB

71

570

CNNRNN

¥79,990

2.2 图灵超算工作站(GT410P)配置推荐-高性能型

深度学习2.jpg

产品型号

主要配置

显存

CUDA处理器FP16性能指标

单位:Tflops

张量处理器FP16性能指标

单位:Tflops

理想算法

价格


2.1

UltraLAB GT410P 14664-MB4X

intel第10代至尊处理器

(10核4.6Ghz )、64GB DDR4 /4*RTX3070/2TB SSD M2.SSD +6TB SATA/双塔式(双2000w) /27"-4K图显

32GB

81

652

CNN

¥79,990

2.2

UltraLAB GT410P 14596-MB5X

intel第10代至尊处理器

(12核4.5Ghz )、96GB DDR4 /5*RTX3070/2TB SSD M2.SSD +8TB SATA/双塔式(双2000w) /27"-4K图显

40GB

102

815

CNN

¥95,000

2.3

UltraLAB GT410P 145128-PC3T

intel第10代至尊处理器

(12核4.5Ghz )、128GB DDR4 /3*RTX3090/ 4TB Pci-SSD+ 10TB SATA/ 双塔式(双2000w)/27"-4K图显

72GB

107

855

CNN+ RNN

¥135,000

2.4

UltraLAB GT410P 14596-PC4X

intel第10代至尊处理器

(12核4.5Ghz )、96GB DDR4 /4*RTX3080/4TB Pci-SSD+ 10TB SATA/双塔式(双2000w) /27"-4K图显

40GB

119

952

CNN

¥105,000

2.5

UltraLAB GT410P 144192-PC4T

intel第10代至尊处理器

(14核4.4Ghz )、192GB DDR4 /4*RTX3090/ 4TB Pci-SSD+ 12TB SATA/双塔式(双2000w) /27"-4K图显

96GB

142

1140

CNN+ RNN

¥159,990

2.6

UltraLAB GT410P 144128-PC5X

intel第10代至尊处理器

(14核4.4Ghz )、128GB DDR4 /5*RTX3080/4TB Pci-SSD+ 10TB SATA/双塔式(双2000w) /27"-4K图显

50GB

149

1190

CNN

¥118,000

2.7

UltraLAB GT410P 144256-PD5T

intel第10代至尊处理器

(14核4.4Ghz)、256GB DDR4 /5*RTX3090/6.4TB Pci-SSD+ 12TB SATA/双塔式(双2000w) /27"-4K图显

120GB

178

1425

CNN+ RNN

¥185,000

2.3 图灵超算工作站(GX630M)配置推荐-极致型

深度学习3.jpg

No

产品型号

主要配置

显存

CUDA处理器FP16性能指标

单位:Tflops

张量处理器FP16性能指标

单位:Tflops

理想算法

价格

3.1

UltraLAB GX630M 243192-MB6X

2*Xeon金6244(16核4.3GHz)/睿频4.4GHz/192GB DDR4 /6*RTX3070 /1.92TB SSD+2TB M2.SSD/42TB存储/双塔式(双2000w)/27"-4K图显

48GB

122

978

CNN

¥195,000

3.2

UltraLAB GX630M 243256-MB7X

2*Xeon金6244(16核4.3GHz)/睿频4.4GHz/192GB DDR4 /7*RTX3070 /1.92TB SSD+2TB M2.SSD/56TB存储/双塔式(双2000w)/27"-4K图显

56GB

142

1141

CNN

¥205,000

3.3

UltraLAB GX630M 243192-MB4T      

2*Xeon金6244(16核4.3GHz)/睿频4.3GHz/192GB DDR4 /4*RTX3090 /1.9TB SSD+2TB M2.SSD/56TB存储/双塔式(双2000w)/27"-4K图显

96GB

142

1140

CNNRNN

¥249,990

3.4

UltraLAB GX630M 243256-PC5X

2*Xeon金6244(16核4.3GHz)/睿频4.4GHz/256GB DDR4 /5*RTX3080 /1.92TB SSD+4TB P-SSD/70TB存储/双塔式(双2000w)/27"-4K图显

50GB

149

1190

CNN

¥215,000

3.5

UltraLAB GX630M 241384-PD5T

2*Xeon金6246(24核4.1GHz)/睿频4.2GHz /384GB DDR4 /5*RTX3090 /1.92TB SSD+4TB P-SSD/90TB并行存储/双塔/27"-4K图显

120GB

178

1425

CNNRNN

¥299,990

3.6

UltraLAB GX630M 241384-PC6X

2*Xeon金6246(24核4.1GHz)/睿频4.2GHz /384GB DDR4 /6*RTX3080 /1.9TB SSD+4TB P-SSD/70TB并行存储/双塔式(双2000w)/27"-4K图显

60GB

179

1428

CNN

¥239,990

3.7

UltraLAB GX630M 243768-13S6T

2*Xeon金6256(24核4.3GHz)/睿频4.5GHz /768GB DDR4 /6*RTX3090 /2*1.92TB SSD+13TB P-SSD/28TB SATA/双塔式(双2000w)/32"-4K图显

144GB

213

1710

CNN+  RNN+  推理

¥375,000

3.8

UltraLAB GX630M 2331T-57S6T

2*Xeon白金8280(56核3.3GHz)/睿频4.0GHz/1.5TB DDR4 /6*RTX3090 /双3.84TB SSD /57TB P-SSD(极速) /32TB SATA/双塔式(双2000w) /32"-4K图显

144GB

213

1710

CNN+  RNN+  推理

¥599,990

上述配置可以看出:

(1)UltraLAB GX630M大部分配置都已超越9块RTX2080ti/7块Titan RTX性能

(2)UltraLAB GX630M(编号3.7)的配置规格,其性能已经接近nvidia DGX-2,但其价格是DGX-2的1/10价格

供参考,欢迎交流。

登录后免费查看全文
立即登录
App下载
技术邻APP
工程师必备
  • 项目客服
  • 培训客服
  • 平台客服

TOP