当前集群状态
当前集群状态
登录集群后可使用slurm命令获取资源,例如 salloc --partition=xxx --qos=xxx --gres=xxx 。 其中 partition qos gres可选参数如下
参数说明:
partition,分区,以区分不同的硬件资源,例如dcu资源和gpu资源。
qos,队列,用户提交的作业将会提交到指定队列内,按优先级排队执行,不同的队列有不同的资源限制和时间限制。
gres,可用硬件资源,例如 gpu:l40:8 代表节点内有gpu卡,型号为l40,卡数为8张
partition,分区,以区分不同的硬件资源,例如dcu资源和gpu资源。
qos,队列,用户提交的作业将会提交到指定队列内,按优先级排队执行,不同的队列有不同的资源限制和时间限制。
gres,可用硬件资源,例如 gpu:l40:8 代表节点内有gpu卡,型号为l40,卡数为8张
其他信息:个人当前作业, 队列
all jobs