超频、PCIe4.0-最新最全深度学习工作站方案2021v2

目录
提升深度学习算力的最新硬件方案
深度学习选择GPU-性能指标最新排序
UltraLAB深度学习工作站新机型介绍
4 UltraLAB 深度学习工作站基准配置方案2021v2
4.1 GA300i深度学习工作站配置推荐(2块GPU方案,超值型)
4.2 GT410P深度学习工作站配置推荐(最大5块GPU方案,高性能型)
4.3 GX650M深度学习工作站配置推荐(最大6块GPU方案,完美极致型)

最新xeon三代+PCIe 4.0架构-深度学习训练、AI智能、神经元计算基准配置推荐2021v2

最新AMD锐龙Pro+PCIe 4.0架构-深度学习训练、AI智能、神经元计算基准配置推荐2021v3


一.提升深度学习性能的最新硬件
随着深度学习、人工智能、大数据AI分析等应用深入,对图形工作站的性能要求越来越高,深度学习主流框架Pytorch、Tensorflow等,在GPU训练神经网络性能指标---训练吞吐量,如何通过模型更快地运行数据集,需要调用更多GPU并行训练,如何提升深度学习算力的硬件性能,关键硬件如下:

No

关键硬件

主要任务

解决方案

1

硬盘读取速度

数据从硬盘读取到内存,并做一些预处理

PCIe 4.0 SSD卡

2

PCIe传输速度

内存中的数据通过PCIe总线传输到GPU显存

PCIe 4.0 x16接口

3

CPU频率

从内存中取出一批数据,转化为numpy array,并作数据预处理/增强操作,如翻转、平移、颜色变换等。处理完毕后送回内存

数据预处理是CPU单核计算,cpu频率至关重要

4

内存

数据从硬盘读取到内存,GPU计算好结果返回到内存

内存容量、带宽

5

GPU卡

计算机视觉(CV)、自然语言处理(NLP)、文本到语音 (TTS) 等的 GPU 训练速度

每秒处理样本()的数量

单卡的CUDA FP32、Tensor FP16指标越高越好

多卡并行数量越大越好


二.深度学习选择GPU-最新性能指标排序
(GPU型号性能对比表,按单精度FP32排序)

No

型号

卡数

CUDA核数

单精度FP32    Tfops

张量计算FP16

(Tfops)

显存带宽GBs

显存  合计GB

备注

1

A6000

7块

75264

280

2184

768

336

超越DGX-2

2

RTX3090

7块

73472

249

1995

936

168

超越DGX-2

3

A6000

6块

64512

240

1872

768

288

超越DGX-2

4

RTX3080

8块

69632

238

1904

760

80

超9*2080ti

5

Tesla V100

16块

81920

238

1760

653

192

DGX-2

6

RTX3090

6块

62976

213

1710

936

144

接近DGX-2

7

A6000

5块

53760

200

1560

768

240

全能高速

8

RTX3080

6块

52224

179

1428

760

60

超5*3090

9

RTX3090

5块

52480

178

1425

936

120


10

A6000

5块

53760

200

1560

768

240

全能高速

11

A5000

6块

49152

166

1302

768

144

全能高速

12

A6000

4块

43008

160

1248

768

192

全能高速

13

RTX3080

5块

43520

149

1190

760

50

超9*2080ti

14

RTX3090

4块

41984

142

1140

936

96


15

RTX3070

7块

41216

142

1141

448

56


16

A5000

5块

40960

139

1085

768

120

全能高速

17

RTX2080Ti

9块

39168

121

990

616

99


18

RTX3070

6块

35328

122

978

448

48

超7块Titan RTX

19

RTX3080

4块

34816

119

952

760

40

超8*2080ti

20

Titan RTX

7块

32256

114

910

672

168


21

A5000

4块

32768

111

868

768

96

全能高速

22

RTX2080Ti

8块

34816

108

880

616

88


23

RTX3090

3块

41984

107

855

936

72


24

RTX3070

5块

29440

102

815

448

40


25

RTX3080

3块

34816

89

714

760

40

超4*titanRTX

26

A5000

3块

24576

84

651

768

72

全能高速

27

RTX3070

4块

23552

81

652

448

32


28

A6000

2块

21504

80

624

768

96

全能高速

29

RTX3090

2块

20992

71

570

936

48


30

Titan RTX

4块

18432

65

520

672

96


31

RTX3070

3块

23552

61

489

448

24


32

RTX3080

2块

17408

60

476

760

20

多用途

33

A5000

2块

16384

56

432

768

48

全能高速

34

RTX2080Ti

4块

17408

54

440

616

44


35

RTX2080s

4

12288

44

252

496

32


36

RTX3070

2块

11776

41

326

448

16

超3090

37

A6000

1块

10752

40

312

768

48

全能高速

38

RTX3090

1块

10496

36

285

936

24

全能高速

39

Titan RTX

2块

9216

32

260

672

48


40

RTX3080

1块

8704

30

238

760

10

科研型

41

A5000

1块

8192

28

217

768

24

全能高速

42

RTX2080Ti

2块

8704

28

220

616

22


43

RTX2080s

2块

3072

22

126

496

16


44

RTX3070

1块

5888

20

163

448

8

科研型

45

Titan RTX

1块

4608

16

130

672

24


46

TITAN V

1

5120

14.90

110

653

12


47

RTX2080Ti

1块

4352

13

110

616

11


三.UltraLAB深度学习工作站新机型介绍
西安坤隆计算机科技有限公司2021年6月新上市两款机型GA300i、GX650M,其特点支持超频、支持PCIe4.0接口,其技术规格如下:

机型1  UltraLAB GA300i产品介绍

超频、PCIe4.0-最新最全深度学习工作站方案2021v2的图1

配置规格:
CPU  支持intel第11代酷睿处理器(8核@5Ghz-全核超频)
内存  最大128GB(双通道)
GPU卡 最大2块RTX30系列
PCIe接口  双PCIe 4.0 x8或单PCIe 4.0 x16
噪音等级  静音级

产品说明:
双槽/三槽GPU卡通吃
比常规CPU频率的机器,在数据预处理方面提升显著

售前:提供远程测试


机型2  UltraLAB GX650M产品介绍
超频、PCIe4.0-最新最全深度学习工作站方案2021v2的图2


超频、PCIe4.0-最新最全深度学习工作站方案2021v2的图3
配置规格:
CPU: 2颗Xeon第3代可扩展处理器(最大80核)
内存:最大4TB(16通道)
GPU卡: 最大6块RTX30系列
PCIe接口:6个PCIe 4.0 x16(6个全速),1个PCIe 4.0 x8
并行存储:16个3.5寸硬盘位
噪音等级:静音级

产品说明:
双槽/三槽GPU卡通吃
PCIe4.0比PCIe3.0架构拥有更快的数据带宽,整体性能提升显著(可远程测试)
内存带宽提升(16通道)
最大300TB并行存储

GX650M在深度学习关键配置选项

No

关键硬件

解决方案

1

硬盘读取速度

选项1  2TB M2.SSD PCIe 4.0接口,读写带宽7GB/s、5GB*/s

选项2  3.84TB/7.68TB PCIe-SSD卡,PCIe 4.0 4x,

2

PCIe传输速度

6个 PCIe 4.0 x16(全速)

3

CPU频率

2颗Xeon 金牌6328H(共计32核@3.7GHz,睿频4.3GHz,基频2.8GHz)

2颗Xeon 铂金8354H(共计36核@4.0GHz,睿频4.2GHz,基频3.1GHz)

2颗Xeon 铂金8360H(共计48核@3.8GHz,睿频4.2GHz,基频3.0GHz)

2颗Xeon 铂金8380H(共计56核@3.8GHz,睿频4.3GHz,基频2.9GHz)

4

内存

最大16通道,DDR4 3200 RECC

192GB(12*16GB)
256GB(16*16GB)
384GB(12*32GB)

512GB(16*32GB)

768GB(12*64GB)

1TB(16*64GB)

5

GPU卡

可选型号:

RTX3080 10GB/RTX3090 24GB

A5000 24GB/A6000 48Gb

数量 最大6块


售前:提供远程测试

四 UltraLAB 深度学习工作站配置方案2021v2

2.1 图灵计算工作站(GA300i)配置推荐(超值型)
技术特点:
CPU高频、最多2块GPU卡(PCIe 4.0 x8接口),超高性价比

GA300i配置推荐:

No

产品型号

主要配置

显存

CUDA处理器FP32性能指标

张量处理器FP16性能指标

理想算法

价格

1.1

GA300i 14832-SAX

intel第11代高频处理器         

( 8核4.8Ghz)/32GB DDR4/ RTX3080 10GB/960GB SSD /4TB SATA/微塔式(2000w) /23"图显

10GB

30Tops

238Tops

CNN

¥38,500

1.2

GA300i 14864-SAT

intel第11代高频处理器          (8核4.8Ghz)/64GB DDR4/     RTX3090 24GB /1.9TB SSD /6TB SATA/微塔式(2000w) /23"图显

24GB

36Tops

285Tops

CNN+ RNN  多用途

¥54,000

1.3

GA300i 14832-SA2X

intel第11代高频处理器(8核@4.8Ghz)/32GB DDR4/2*RTX3070 8GB/1.9TB SSD /6TB SATA/微塔式(2000w)/23"图显

16GB

41Tops

326Tops

CNN高性价比

¥49,990

1.4

GA300i 15064-SB2X

intel第11代高频处理器(8核@5.0Ghz)/64GB DDR4/2*RTX3080 10GB/1.9TB SSD/6TB SATA/微塔式(2000w)/23"图显

20GB

60Tops

476Tops

CNN  超4*2080ti

¥68,000

1.5

GA300i 15096-SC2T

intel第11代处理器(8核5.0Ghz) /96GB DDR4 /2*RTX3090 24GB /3.84TB SSD /8TB SATA/微塔式(2000w)/23"图显

48GB

71Tops

570Tops

CNN+ RNN 超4块Titan RTX

¥83,000

1.6

GA300i 150128-SC2D

intel第11代处理器(8核5.0Ghz) /128GB DDR4 /2*A5000 24GB/ 3.84TB SSD /8TB SATA/微塔式(2000w)/23"图显

48GB

56Tops

520Tops

CNN+ RNN 超4块2080TI

¥94,500

1.7

GA300i 150128-SC2E

intel第11代处理器( 8核5.0Ghz) /128GB DDR4 /2*A6000 48GB/ 3.84TB SSD /8TB SATA/微塔式(2000w)/23"图显

96GB

80Tops

624Tops

CNN+ RNN 超4块Titan RTX

¥145,000

2.2 图灵超算工作站(GT410P)配置推荐(高性能型)
技术特点:
超高CPU频率,最多5块GPU卡(双槽卡、三槽卡通吃),支持并行存储,
GT410P配置推荐:

No

产品型号

主要配置

显存

CUDA处理器FP32性能指标

张量处理器FP16性能指标

理想算法

价格

2.1

GT410P 14664-MB4X

intel第10代至尊处理器(10核4.6Ghz)/64GB DDR4/4*RTX3070 /2TB M2.SSD+6TB SATA/双塔式(双2000w) /27"-4K图显

32GB

81Tops

652Tops

CNN

¥94,500

2.2

GT410P 14596-MB5X

intel第10代至尊处理器(12核4.5Ghz )/96GB DDR4/5*RTX3070 /2TB M2.SSD+8TB SATA/双塔式(双2000w) /27"-4K图显

40GB

102Tops

815Tops

CNN

¥112,000

2.3

GT410P 145128-MB3T

intel第10代至尊处理器(12核4.5Ghz)/128GB DDR4/3*RTX3090960GB SSD/2TB M2.SSD/10TB SATA /双塔式(双2000w)/27"-4K图显

72GB

107Tops

855Tops

高性能多用途

¥129,990

2.4

GT410P 145128-MB4X

intel第10代至尊处理器(12核4.5Ghz)/128GB DDR4/4*RTX3080/ 960GB SSD/2TB M2.SSD/10TB SATA/双塔式(双2000w) /27"-4K图显

40GB

119Tops

952Tops

性能超8块2080ti

¥129,990

2.5

GT410P 144192-MB4T

intel第10代至尊处理器( 14核4.4Ghz)/192GB DDR4/4*RTX3090/ 960GB SSD/2TB M2.SSD/12TB SATA/双塔式(双2000w )/27"-4K图显

96GB

142Tops

1.14PTos

性能超7块TitanRTX

¥159,990

2.6

GT410P 144128-MB5X

intel第10代至尊处理器(14核4.4Ghz)/128GB DDR4/5*RTX3080/ 960GB SSD/2TB M2.SSD/10TB SATA /双塔式(双2000w)/27"-4K图显

50GB

149Tops

1.19PTos

CNN

¥155,000

2.7

GT410P 144256-MB5T

intel第10代至尊处理器(14核4.4Ghz)/256GB DDR4/5*RTX3090/ 1.9TB SSD/2TB M2.SSD/12TB SATA  /双塔式(双2000w)/27"-4K图显

120GB

178Tops

1.43PTos

高性价比多用途

¥189,000

2.8

GT410P 144192-MB5D

intel第10代至尊处理器(14核4.4Ghz)/192GB DDR4/5*A5000/ 1.9TB SSD/2TB M2.SSD/12TB SATA /双塔式(双2000w)/27"-4K图显

120GB

139Tops

1.08PTos

超高性价比海量计算

¥210,000

2.9

GT410P 144256-MB5E

intel第10代至尊处理器(14核4.4Ghz)/256GB DDR4/5*A6000/ 1.9TB SSD/2TB M2.SSD/12TB SATA /双塔式(双2000w)/27"-4K图显

240GB

200Tops

1.56PTos

极致性能海量计算

¥335,000

2.3 图灵超算工作站(GX650M)配置推荐(极致型)
技术特点:
高主频,最多6块GPU卡(全部PCIe 4.0 x16,双槽卡、三槽卡通吃),PCIe4.0 接口SSD卡,支持最大16个判为海量并行存储,
每个环节都达到最佳,完美、强大的深度学习配置架构,还是静音级
GX650M配置推荐

 

No

产品

型号

主要配置

显存

CUDA处理器FP32性能指标

张量处理器FP16性能指标

理想算法

价格

4.1

GX630M

236192-

42T5X

2*Xeon金6346

(32核3.6GHz)/

192GB DDR4/

5*RTX3070 /

3.84TB SSD/

42TB并行存储/

双塔式(双2000w)/

27"-4K图显

40GB

102Tops

815Tops

CNN

¥189,990

4.2

GX650M

236256-

56T6X

2*Xeon金6346

(32核3.6GHz)/

256GB DDR4/

6*RTX3070 /

3.84TB SSD/

56TB并行存储/

双塔式(双2000w)/

27"-4K图显

48GB

122Tops

978Tops

CNN

¥205,000

4.3

GX650M

236256-

42T5X

2*Xeon金6346

(32核3.6GHz)/

256GB DDR4/

5*RTX3080/

1.92TB SSD/

2TB M2 SSD/

42TB并行存储/

双塔式(双2000w)/

27"-4K图显

50GB

149Tops

1.19PTos

计算机视觉完美型

¥226,000

4.4

GX650M

236256-

42T4D

2*Xeon金6346

(32核3.6GHz)/

256GB DDR4/

4*A5000/

1.92TB SSD/

2TB M2 SSD/

42TB并行存储/

双塔式(双2000w )/

27"-4K图显

96GB

111Tops

880Tops

CNN+RNN全能型

¥249,000

4.5

GX650M

236256-

56T6X

2*Xeon金6354

(36核3.6GHz)/

256GB DDR4/

6*RTX3080/

1.92TB SSD/

2TB M2 SSD/

56TB并行存储/

双塔式(双2000w)/

27"-4K图显

60GB

179Tops

1.43PTos

CNN最快

¥259,000

4.6

GX650M

243384-

80T4T      

2*Xeon金6354

(32核3.6GHz)/

384GB DDR4/

4*RTX3090/

1.92TB SSD/

2TB M2 SSD/

80TB并行存储/

双塔式(双2000w)/

27"-4K图显

96GB

142Tops

1.14PTfops

全能+完美

¥268,000

4.7

GX650M

234384-

90T5T

2*Xeon金6348

(56核3.4GHz)/

384GB DDR4/

5*RTX3090/

1.92TB SSD/

2TB M2 SSD/

90TB并行存储/

双塔(双2000w)/

27"-4K图显

120GB

178Tops

1.43PTos

全能+极致

¥299,500

4.8

GX650M

236512-

120T6T

2*Xeon金6354

(36核3.6GHz)/

512GB DDR4/

6*RTX3090 /

3.84TB SSD/

2TB M2.SSD/

120TB并行存储/

双塔式(双2000w)/

32"-4K图显

144GB

213Tops

1.71PTos

近16块Titan V最快最完美

¥395,000

4.9

GX650M

236768-

150T6D

2*Xeon金6354

(36核3.6GHz)/

768GB DDR4/

6*A5000/

1.92TB SSD/

2TB M2.SSD/

150TB并行存储/

双塔式(双2000w)/

32"-4K图显

144GB

166Tops

1.33PTos

最快最完美,性能超DGX-2

¥399,990

4.10

GX650M

236384-

150T5E

2*Xeon金6354

(36核3.6GHz)/

384GB DDR4/

5*A6000/

1.92TB SSD/

2TB M2.SSD/

150TB并行存储/

双塔式(双2000w)/

32"-4K图显

240GB

200Tops

1.56PTos

CNN+  RNN+  推理

¥480,000

4.11

GX650M

2331T-

240T6E

2*Xeon铂金8358

(64核3.3GHz)/

1TB DDR4/

6*A6000/

3.84TB SSD/

2TB M2.SSD/

240TB并行存储/

双塔式(双2000w)/

32"-4K图显

288GB

240Tops

1.8PTos

最强最完美,性能超DGX-2

¥630,000

 

最新xeon三代+PCIe 4.0架构-深度学习训练、AI智能、神经元计算基准配置推荐2021v2

最新AMD锐龙Pro+PCIe 4.0架构-深度学习训练、AI智能、神经元计算基准配置推荐2021v3



UltraLAB图形工作站供货商:
西安坤隆计算机科技有限公司
国内知名高端定制图形工作站厂家
业务电话:400-705-6800

微信号.jpg


 



 

 

默认 最新
当前暂无评论,小编等你评论哦!
点赞 评论 收藏
关注