|
我用的是曙光机群,开放了8个节点
在做并行计算时候,用到的命令是mpirun -np 8 wrf.exe
如果我的计算量比较大,只能用一个节点,即-np 1是可以的,多于1就不行,进程出现defunct
如果改小设置,计算量不大,可以用多个,1-8个节点都可以成功的
不知道是什么原因导致的?内存问题吗?谢谢帮助
我用ulimit -a 命令显示如下信息:
core file size (blocks, -c) 0
data seg size (kbytes, -d) unlimited
file size (blocks, -f) unlimited
pending signals (-i) 1024
max locked memory (kbytes, -l) 32
max memory size (kbytes, -m) unlimited
open files (-n) 16384
pipe size (512 bytes, -p) 8
POSIX message queues (bytes, -q) 819200
stack size (kbytes, -s) 10240
cpu time (seconds, -t) unlimited
max user processes (-u) 40960
virtual memory (kbytes, -v) unlimited
file locks (-x) unlimited |
|