Ansys Fluent 提交并行求解作业到Slurm系统的介绍 | HPC

Slurm(Simple Linux Utilities for Resource Management)是一款集群资源管理及作业调度系统,适用于Linux集群环境。目前Slurm作为一款免费且开源的软件,被全世界很多超算中心,研发企业、实验室及大学部署并使用。在 TOP500 排名前 10 的HPC系统中,有超过半数是使用Slurm来执行工作负载管理工作。


目前,Ansys软件也支持使用Slurm来完成并行求解作业的任务提交和管理,本文介绍Ansys Fluent 2023R1版本并行求解作业提交到Slurm系统的相关操作。


Ansys Fluent 提交并行求解作业到Slurm系统的介绍 | HPC的图1


. Ansys RSM方式提交


1、首先在Linux集群管理节点启动Ansys RSM Launcher服务。


Ansys Fluent 提交并行求解作业到Slurm系统的介绍 | HPC的图2


2、打开Windows端的“RSM Configuration 2023 R1”配置工具,完成Slurm资源的添加配置。


Ansys Fluent 提交并行求解作业到Slurm系统的介绍 | HPC的图3Ansys Fluent 提交并行求解作业到Slurm系统的介绍 | HPC的图4Ansys Fluent 提交并行求解作业到Slurm系统的介绍 | HPC的图5

Ansys Fluent 提交并行求解作业到Slurm系统的介绍 | HPC的图6


3、打开Windows端的“RSM Cluster Monitoring 2023 R1”工具,可以看到刚配置完成的Slurm队列的资源状态:2个计算节点(node1和node2),每节点8个CPU Core。


Ansys Fluent 提交并行求解作业到Slurm系统的介绍 | HPC的图7


4、在Ansys Workbench中打开Ansys Fluent测试算例,并按图示1~4步骤的操作说明,完成Fluent作业的远程提交。如果项目中有多个待分析任务的话,建议使用右键菜单的Update选项,来准确定位要提交求解的分析任务。


Ansys Fluent 提交并行求解作业到Slurm系统的介绍 | HPC的图8

Ansys Fluent 提交并行求解作业到Slurm系统的介绍 | HPC的图9

Ansys Fluent 提交并行求解作业到Slurm系统的介绍 | HPC的图10


5、打开“Job Monitor”工具,查看运行中的作业状态。


Ansys Fluent 提交并行求解作业到Slurm系统的介绍 | HPC的图11


6、Linux管理节点上,我们也可以通过squeue命令查看运行中的Slurm作业的状态。


Ansys Fluent 提交并行求解作业到Slurm系统的介绍 | HPC的图12


7、计算完成后,计算结果自动传回Windows主机上的项目文件目录,我们在本地完成后处理工作。


Ansys Fluent 提交并行求解作业到Slurm系统的介绍 | HPC的图13

Ansys Fluent 提交并行求解作业到Slurm系统的介绍 | HPC的图14


. sbatch批处理方式提交


1、工作目录中上传Ansys Fluent算例、Journal文件及sbatch的批处理文件。


Ansys Fluent 提交并行求解作业到Slurm系统的介绍 | HPC的图15


2、slurm.sh批处理文件中,定义了任务名:test,标准输出文件,错误输出文件,slurm队列名:debug,计算节点数:2,每节点并行进程数量:6。


Ansys Fluent 提交并行求解作业到Slurm系统的介绍 | HPC的图16


3、执行“sbatch slurm.sh”命令完成作业提交,作业号为174。


Ansys Fluent 提交并行求解作业到Slurm系统的介绍 | HPC的图17

Ansys Fluent 提交并行求解作业到Slurm系统的介绍 | HPC的图18


4、计算完成后,工作目录生成了对应的结果文件,日志文件,过程文件。需手动下载文件到本地,进行后处理工作。


Ansys Fluent 提交并行求解作业到Slurm系统的介绍 | HPC的图19


. 总结


对比来看,通过Ansys RSM图形化界面提交作业的使用方式,不仅省去了上传算例,下载结果的手动操作,还省去了编写Slurm批处理文件,Fluent Journal文件的工作,对使用者相对友好。

文章来源于南京安世亚太 ,作者葛琎

Ansys.Fluentansys hpc设置

Ansys Fluent 提交并行求解作业到Slurm系统的介绍 | HPC的评论0条

    暂无评论

    Ansys Fluent 提交并行求解作业到Slurm系统的介绍 | HPC的相关案例教程

    1 Ansys Remote Solve Manager (RSM)功能简介 Ansys Remote Solve Manager(RSM)提供了配置和监视作业提交到HPC资源的核心框架。无论作业是提交到集群还是提交到云端,RSM的集成环境和工具都能让您轻松连接到现有的IT设备,在需要时为您提供对强大计算资源的无缝访问。 作业可以从应用程序客户端(如Ansys Workbench)直接提交给RSM
    1 Ansys Remote Solve Manager (RSM)功能简介 Ansys Remote Solve Manager(RSM)提供了配置和监视作业提交到HPC资源的核心框架。无论作业是提交到集群还是提交到云端,RSM的集成环境和工具都能让您轻松连接到现有的IT设备,在需要时为您提供对强大计算资源的无缝访问。 作业可以从应用程序客户端(如Ansys Workbench)直接提交给RSM
    1 Ansys Remote Solve Manager (RSM)功能简介 Ansys Remote Solve Manager(RSM)提供了配置和监视作业提交到HPC资源的核心框架。无论作业是提交到集群还是提交到云端,RSM的集成环境和工具都能让您轻松连接到现有的IT设备,在需要时为您提供对强大计算资源的无缝访问。 作业可以从应用程序客户端(如Ansys Workbench)直接提交给RSM
    Slurm ( Simple Linux Utility for Resource Management )是开源的、具有容错性和高度可扩展大型和小型 Linux集群资源管理和作业调度系统。超级计算系统可利用 Slurm 进行资源和作业管理,以避免相互干扰,提高运行效率。所有需运行的作业无论是用于程序调试还是业务计算均必须通过交互式并行 srun、批处理式 sbatch 或分配式 salloc 等
    背景 近三十年来,生命科学与计算科学飞速发展。生物信息学是一门生命科学与计算科学的前沿交叉学科。生物信息学产生和迅猛发展的主要推动力来自于新一代测序等高通量技术在生命科学领域越来越广泛的应用。 基因组学是这一趋势的一个主要例子,其中高通量下一代测序 (NGS) 设备被用于对 DNA、mRNA、调控区域、肠道微生物组等进行测序。计算工作流程也在快速开发和标准化,并且支持动态进行扩展。随着大量基因组数
    影响力
    粉丝
    内容
    获赞
    收藏
      0 0
      研学季