结构流体多物理场耦合高性能仿真计算集群配置推荐2022v4

集群面临问题

经常听到客户反馈,某某分布式多机集群、某某云计算平台,在集群上做计算还不如普通电脑快,高性能计算集群做工程仿真计算效率很低,花了一大笔经费,经过一年多的方案论证、审批通过、采购、交货、使用,但集群性能表现很差
结构流体多物理场耦合高性能仿真计算集群配置推荐2022v4的图1

看似高性能集群的计算服务器、存储服务器、管理服务器、infiniband交换机等硬件设备放到机柜上,通过网络交换机全部连接好,系统、软件、开发工具也都安装调试正常了,HPC集群就OK了,真这么简单吗? 实际情况:
可能1  计算服务器硬件配置选型不合理,
可能2  并行存储服务器硬件配置有问题
可能3  作业调度方法存在问题
可能4  计算方式选择有问题,通过GPU计算更快,但确用CPU计算方式
可能5  网络io有问题,永远是满负荷
。。。
出现这些问题的原因,集群的配置方案往往是使用者想要一个“最先进、成熟的”集群计算架构,自己认为的一个方案,或者过度相信“丰富有经验的系统集成商”(大品牌,不用质疑),根据客户的预算,给出的高性能计算集群方案
使用者大部分是对软件熟悉,对工作计算任务熟悉,但因工作知识的局限性,可能对硬件配置,最新计算架构不是很精通,
集成商,大部分都是卖设备的,关心的是设备能否卖出去,对客户应用了解很少或不是很深入,因此这样两类人,在一起交流讨论仿真计算集群硬件配置方案,未来必然存在隐患。
那么一个合理、完美、高效的高性能计算集群方案的关键点都有什么?
首先 要根据客户的应用要求,跑什么软件,对这些软件特点进行分析
其次,根据掌握了应用情况,结合最新的硬件规格,分别给出计算服务器、GPU服务器、并行存储服务器、管理服务器、网络低延迟的交换机的对应方案,另外还要配备好一个高效的作业调度系统,这样这个集群方案更贴近仿真软件的计算要求,
关键点1  计算服务器用什么规格CPU、GPU、内存、硬盘,性能最大化?
关键点2  存储服务器,作为数据交换最密集的地方,最大的瓶颈,是什么?
不能忽略的情况:
如果不知道仿真数值模拟软件的不同求解器的特点,很可能计算服务器配置正常,软件运行正常,速度很慢,怎么回事?
如果不熟悉计算硬件架构,计算服务器的CPU频率高低无所谓,内存带宽无所谓,硬盘io无所谓,便宜就行,可能结果性能表现很差
如果不清楚很多软件已经支持GPU加速,求解过程得到10几倍的提升(用CPU就可以,或用最贵的GPU,也不快,什么情况?)
如果不清楚作业调度正确方式,按核调用,计算规模越大,分配更多核,速度就快?
因此,集群配置缺陷,将来必然面临并行计算效率低,性能表现差的问题,再加上作业调度软件问题或使用问题,集群运算效率自然好不到哪里。

(二)CX650高性能仿真计算集群

西安坤隆计算机公司,经过多年实际集群系统的应用软件运行和监测分析,我们可以给出从集群硬件配置和集群架构、作业调度全方位的满足不同仿真计算特点,通过采用最新CPU和GPU,以及合理硬件配置和高效作业调用,保证了集群的计算效率发挥到最大。
 
UltraLAB高性能仿真计算集群充分考虑应用软件的算法特点,保证整个集群每个环节,计算服务器或GPU超算服务器,并行存储服务器等集群配置架构,无死角、无卡顿、均衡,都能最大限度发挥各自的性能,

应用软件并行计算特点


应用种类

主要软件类

计算特点

计算设备

1

结构静力/动态仿真

Ansys

Abaqus

Ly-Dyna

 

有限元法,纯CPU计算

两个环节:

1 网格自动剖分—单核计算,高频才能加速

2 求解器求解—有限多核计算,调用合理的计算资源,加速

上述过程,反复迭代,直到收敛为止,

高频服务器

计算服务器

2

流体仿真

Fluent

有限体积法,CPU和GPU结合

计算服务器

GPU计算服务器

3

多物理场耦合

Comsol Multiphysics..

有限元法,纯CPU计算

高频+有限多核+大内存带宽

高频服务器

计算服务器

4

电磁仿真

HFSS、CST 、Feko..

频域类,有限元法,纯CPU计算

时域类,时域有限差分,GPU加速

高频服务器

计算服务器

GPU计算服务器

5

科学计算类

MatLAB

解释型高级语言工具,主模块单核计算为主,需要多核并行,要借助【并行计算工具箱】

计算服务器

 

CX650仿真集群系统介绍

CX650是采用intel xeon第三代可扩展处理器组成的集群,代表着目前最新的计算架构,求解更快、更高效。CX650集群系统是由【高频服务器】、【计算服务器】、【GPU超算服务器】、【管理与存储服务器】、【高性能低延迟交换机】、作业调度系统组成。

No

关键设备

配置规格

主要任务或功能

1

高频服务器

2颗或4颗Xeon高频处理器/大容量内存/高速固态盘/25G/56G 高性能网卡

针对有限元仿真计算网格剖分单核cpu计算特点,面对多个计算服务器计算过程的并发网格剖分,通过配置超高频CPU,大大缩短同时多个网格剖分计算时间,从而加速整个求解计算

2

计算服务器

2颗xeon+16根内存+25G/56G 高性能网卡

针对基于CPU计算的仿真模拟计算的重要计算过程---求解器求解,配备最新2颗intel Xeon3代处理器,40核@高频+16通道内存带宽打造理想高速计算架构,每个计算节点高频+多核并行计算+内存IO带宽最大化,在核数与频率、低延迟响应达到完美均衡。

3

GPU超算服务器

配备最新2颗intel Xeon3代处理器(32核@高频+16通道内存带宽)25G/56G 高性能网卡,

针对基于CPU和GPU异构超算,支持CPU仿真模拟计算,也支持GPU加速计算,

最新GPU(RTX A6000 48GB)单精度浮点算力40Tflops,可用于支持GPU求解计算,性能提升显著,例如Fluent求解,一块A6000卡算力(FP32 40Tflops)相当于44颗Xeon 银牌4316(累计880核)性能,

4

管理与存储服务器

双xeon(核数充足)/高速缓存盘/并行存储/56G/100G高性能网卡

承担高速并行计算的海量数据密集读写,提供最强大的并行读写存储架构

承担集群管理

5

PSS作业调度软件

基于linux环节

支持全面任务调度,支持多种计算架构,支持混合计算架构

一款成熟、高可靠、易管理的作业调度软件,保证多任务计算作业调度、监控


 

(三)CX650高性能仿真计算集群配置推荐

方案1 5个计算节点集群配置方案推荐

总核数:200核@2.8GHz ,

CPU算力 8.9TFlops

总内存容量 1.28TB

NO

货物名称

型号

数量

单价

小计

1

计算服务器

Xeon银牌4316(40核2.8Ghz)/256GB DDR4 /960GB SSD/2U机架式/56G IB网口

5

53800

269000

2

GPU计算服务器

可选项

 




3

管理与存储服务器

2*Xeon 银4316(40核@2.3GHz)/128GB DDR4/Quadro T1000 /480GB SSD /7.68TB缓存盘/112TB并行存储/4U机架式/100G IB网口/27"4K图显

1

110000

110000

4

计算交换机

Infiniband 12口 56G/100G

1

38000

38000

5

管理交换机

16口千兆以太

1

1600

1600

6

服务器机柜

42U,含PDU机柜插座、托盘

1

6500

6500

7

KVM切换器

16口 VGA

1

1500

1500

8

管理软件

UltraLAB作业调度软件(5节点)

1

50000

50000







累计(人民币):




¥476,600


 

方案2 10个计算节点集群配置方案推荐

总核数:400核@2.8GHz ,

CPU算力 17.9TFlops 

GPU算力(FP32) 80Tfops

总内存容量 2.56TB

 

NO

货物名称

型号

数量

单价

小计

1 高频服务器

Xeon 金牌6256(12核4.3GHz)/512GB DDR4 /3.84TB PCIeSSD/2U机架式/56G IB网口

1 71500 71500

2

计算服务器

Xeon银牌4316(40核2.8Ghz)/256GB DDR4 /960GB SSD/2U机架式/56G IB网口

8

53800

430400

3

GPU计算服务器

Xeon银牌4316(40核2.8Ghz)/256GB DDR4 /RTX A6000 48GB/960GB SSD /4U机架式/56G IB网口 

2

96000

192000

4

管理与存储服务器

2*Xeon 银4316(40核@2.3GHz)/128GB DDR4/Quadro T1000 /480GB SSD /7.68TB缓存盘/112TB并行存储/4U机架式/100G IB网口/27"4K图显

1

110000

110000

5

计算交换机

Infiniband 36口 56G/100G

1

63000

63000

6

管理交换机

16口千兆以太

1

1600

1600

7

服务器机柜

42U,含PDU机柜插座、托盘

1

6500

6500

8

KVM切换器

16口 VGA

1

1500

1500

9

管理软件

UltraLAB作业调度软件(11节点)

1

110000

110000







累计(人民币):




¥986,500


 

方案3 15个计算节点集群配置方案推荐

总核数:600核@2.8GHz ,

CPU算力 26.88TFlops 

GPU算力(FP32) 80Tfops

总内存容量 3.84TB

 

NO

货物名称

型号

数量

单价

小计

1 高频服务器

Xeon 金牌6256(12核4.3GHz)/512GB DDR4 /3.84TB PCIeSSD/2U机架式/56G IB网口

1 71500 71500

2

计算服务器

Xeon银牌4316(40核2.8Ghz)/256GB DDR4 /960GB SSD/2U机架式/56G IB网口

13

53800

430400

3

GPU计算服务器

Xeon银牌4316(40核2.8Ghz)/256GB DDR4/RTX A6000 48GB/960GB SSD /2U机架式/56G IB网口 

2

96000

192000

4

管理与存储服务器

2*Xeon 银4316(40核@2.3GHz)/128GB DDR4/Quadro T1000 /480GB SSD /7.68TB缓存盘/112TB并行存储/4U机架式/100G IB网口/27"4K图显

1

110000

110000

5

计算交换机

Infiniband 36口 56G/100G

1

63000

63000

6

管理交换机

24口千兆以太

1

2100

2100

7

服务器机柜

42U,含PDU机柜插座、托盘

2

6500

13000

8

KVM切换器

16口 VGA

2

1500

1500

9

管理软件

UltraLAB作业调度软件(16节点)

1

160000

160000







累计(人民币):




¥1,312,000


 

上述所有配置,代表最新硬件架构,同时保证是最完美,最快。

欲咨询机器处理速度如何、技术咨询、索取详细技术方案,提供远程测试,请联系


UltraLAB图形工作站供货商:
西安坤隆计算机科技有限公司
国内知名高端定制图形工作站厂家
业务电话:400-705-6800,18601230361

咨询微信号:

微信号.jpg
默认 最新
当前暂无评论,小编等你评论哦!
点赞 评论 收藏
关注