Moldex3D远端计算的常见问题之一

Moldex3D远程计算 ( Remote Computing ) 的常见错误 (Common errors of Moldex3D Remote Computing)

•process X exited without calling finalize

•Functions with MPI_ prefix are failed

耗尽所有的端点

使用者登入失败,错误1326

凭证被拒绝

创建失败 \\.......\....\console_redirection_.....log  

最大任务数为零

•Moldex3D 求解器在Windows Server 2019的不稳定性

Windows 10 10 分钟后释放连入 SMB 连接

process X exited without calling finalize

Moldex3D远端计算的常见问题之一的图1

Process X exited without call finalize”表示它已挂机,因为每个求解器进程在退出之前都必须叫出 MPI_Finalize”。

接下来,我们的工程师可以怎么做呢?

1.执行"Diagnostics" 诊断测试

2.使用同一组的计算资源来执行范例测试

-同一组的计算资源,意味着:

o使用相同的计算节点

o每个计算节点使用相同的核心数

如果以上两个步骤的结果显示为 no error 没有错误,请联系求解器团队来做更进一步地调查。

Functions with MPI_ prefix are failed

Moldex3D远端计算的常见问题之一的图2

只有 < 1% 的此类错误与网络问题有关,> 99%的此类错误与求解器的错误有关。

如果任何求解器进程挂机,则该进程与所有其他进程之间的 MPI 连接将终止。 这就是为什么显示“现有连接被远程主机强制关闭” 讯息的原因。

Process X exited without call finalize”表示它已挂机,因为每个求解器进程在退出之前都必须叫出 MPI_Finalize”。

接下来,我们的工程师可以怎么做呢?

1.执行 "Diagnostics" 诊断测试

2.使用同一组的计算资源来执行范例测试

-同一组的计算资源,意味着:

o使用相同的计算节点

o每个计算节点使用相同的核心数

如果以上两个步骤的结果显示为 no error 没有错误,请联系求解器团队来做更进一步地调查。

耗尽所有的端点( Exhausted all end points )

Moldex3D远端计算的常见问题之一的图3

系统的网络资源耗尽

接下来,我们的工程师可以怎么做呢?

-从丛集的所有节点中,卸除/禁用防病毒软件,然后再次执行分析。

o建议卸除。

-请检查是否安装了 Moldex3D 远程计算 R11”。 如果是,请将其卸除。

o远程计算自R12以来是一个全新的架构。

o远程计算R11有缺陷(它并不是我方开发),我们的许多客户也都遭受系统资源耗尽的问题。

使用者登入失败,错误1326

Moldex3D远端计算的常见问题之一的图4

使用“以使用者身份执行”帐户登入系统失败。 “错误 1326 是由未知的帐户或错误的密码所导致的。

接下来,我们的工程师可以怎么做呢?

-进入主节点,打开 Moldex3D 工作排程器的服务配置。

-修改帐户/密码

-执行 diagnostic诊断测试   如果成功,请再次执行分析。

凭证被拒绝 (Credential is rejected)

Moldex3D远端计算的常见问题之一的图5

当凭证用于登入计算节点时,一个或多个计算节点拒绝该凭证。

当您打开日志档案(log file),则可以看到拒绝该凭证节点的 IP 地址。

Moldex3D远端计算的常见问题之一的图6

接下来,我们的工程师可以怎么做呢?

-进入主节点,然后打开 Moldex3D 工作排程器的接口。

-执行 "diagnostic诊断测试

-根据解决方法,进入拒绝凭证的计算节点,在Windows控制面板中修改密码。

Moldex3D远端计算的常见问题之一的图7

创建失败 \\.......\....\console_redirection_.....log

Moldex3D远端计算的常见问题之一的图8

创建日志档案(log files)失败。 这是因为“以使用者身份执行”账户对工作活页夹没有权限。

接下来,我们的工程师可以怎么做呢?

-进入主节点,然后打开 Moldex3D 工作排程器的接口。

-执行 diagnostic诊断测试

Moldex3D远端计算的常见问题之一的图9

o解决方案:

1.打开 Windows 档案总管。

2.进入工作活页夹本地路径(例如:D:\WorkingFolder)。

3.右键单击工作活页夹,并选择属性。

4.选择“分享”。

5.检查“以使用者身份执行”(例如:MDXParallelComputing)是否具有完全的控制权限。

(1条)
默认 最新
谢谢分享
评论 点赞
点赞 1 评论 1 收藏
关注