超算平台,利用MPP LS-DYNA计算,日志文件显示卡住不往下算了? 100

浏览:2602 回答:11 采纳:3

    在并行超算云服务平台上利用MPP LS-DYNA计算模型。对于同一模型,选择用不同的节点个数进行计算,节点个数是1,2,3的算例都能正常运行(通常15-20分钟内便可经过上图中标红的那步),但是当节点个数是4的时候,到图1所示的进展时就不往下算了。

超算平台,利用MPP LS-DYNA计算,日志文件显示卡住不往下算了?的图1图1

    当节点个数是4的时候,也可能是到图2所示的进展时就不往下算了。图2的进展比图1多,已经算过了“Performing Decomposition – Phase 2

哈哈哈,又卡了.png

超算平台,利用MPP LS-DYNA计算,日志文件显示卡住不往下算了?的图3超算平台,利用MPP LS-DYNA计算,日志文件显示卡住不往下算了?的图4图2

    进一步增设节点个数为5,报图3错误。

1111.png     图3

    请各位专家、同学不吝赐教,这种问题该如何解决呢?以及出现这种问题的原因是什么呢

邀请回答 我来回答

全部回答

(8)
默认 最新
憶森
节点数设置为3
2022年10月19日
已采纳 评论 1 点赞 2
安邦世家
这个问题我也遇到过,换了软件就好了
2024年3月16日
已采纳 评论 1 点赞 1
Sahariver
有报错的节点数设置都不用就行了。
2023年2月28日
已采纳 评论 1 点赞 1
Sahariver
并行超算平台目前T区和T6区CPU型号和内存容量均相同。但是在T6区用3个节点可以跑起来的模型,在T区只能用1个节点跑起来。以下是并行超算平台工程师给的答复,可能能提供一些解决问题的思路:T和T6的配置只能说是大体相同,比如CPU型号和内存容量。其余还有很多软硬件环境是有些差异的。 我咨询了很多性能优化的同事,同样的软件版本和算例,在不同的资源情况下只有固定的核数可以跑并不新鲜。
2023年1月18日
评论 点赞 1
Sahariver
图1和图2是卡住不能往下算的问题。图3是内存溢出问题。
2023年10月10日
已采纳 评论 点赞
Sahariver
有的时候减少节点数目也可以解决图1和图2的问题。对于某一特定模型而言,随着节点数目的增加,计算效率变快,再增加计算效率降低。在测试某一模型所需的节点数目时,必须从1个节点开始慢慢往上测。如果说直接测试多个节点,出现卡顿现象,不一定是由于节点数目不足导致的,反而可能是因为一上来节点数目设置过大导致的。
2023年10月10日
已采纳 评论 点赞
Sahariver
有的时候增大节点数目是可以解决图1和图2的问题的,并不会出现图3的报错提示。
2023年2月28日
已采纳 评论 点赞
Sahariver
针对图1的现象,超算工程师给出的解答是在T6区可以用480核运行算例以及算例文件在4G大小,卡住现象可能是因为软件在给每个核心做大量的文件IO读写操作,结合“Performing Decomposition”分解执行提示,很可能在进行文件读取的任务分解阶段在对每个核心进行数据读取与分发工作。 由于超算上使用的是网络文件系统,文件IO读写确实不是其擅长的。 针对图1现象,可以尝试使用计算节点的内存作为IO介质,将工作路径及相关文件拷贝到计算节点/tmp目录中,通过调用/tmp路径中的输入文件加速IO过程。(但是这个分析并不能解释图2为什么算不过去)
2023年2月28日
评论 点赞

没解决?试试专家一对一服务

换一批
    App下载
    技术邻APP
    工程师必备
    • 项目客服
    • 培训客服
    • 平台客服

    TOP