我正在Bluehive中运行代码。代码有一些参数N.如果N很小,那么代码运行得很好。但是,对于稍微大的N(例如N = 10)的码被运行数个小时,并在结束时我收到以下错误消息:slurmstepd:错误:在某个点超出步骤内存限制
slurmstepd: error: Exceeded step memory limit at some point.
其中我提交批处理文件有以下代码:
#!/bin/bash
#SBATCH -o log.%a.txt -t 3-01:01:00
#SBATCH --mem-per-cpu=1gb
#SBATCH -c 4
#SBATCH --gres=gpu:1
#SBATCH -J Ankani
#SBATCH -a 1-2
python run.py $SLURM_ARRAY_TASK_ID
我为代码分配了足够的内存。但仍然得到错误
"slurmstepd: error: Exceeded step memory limit at some point."
有人可以帮忙吗?