登录高能AI算力平台
使用ssh登录和使用
登录节点ailogin001.ihep.ac.cn
ssh <username>@ailogin.ihep.ac.cn
- 登录后您将位于登录节点
ailogin
上
基本指令
Linux
基本指令
pwd
查看当前路径,如/aifs/user/home/<your_name>
htop
查看CPU、内存、进程等信息df -h
查看磁盘使用情况,其中/aifs
为共享存储,/aifs/user/home
为用户家目录,/aifs/user/data
为用户数据目录,/aifs/public/data
为公共数据目录nvidia-smi
查看GPU情况,注:仅在GPU节点有效hy-smi
或rocm-smi
查看DCU情况,注:仅在DCU节点有效
Slurm
基本指令
sinfo
查看集群资源情况,例如:查询到有三个partitions
,分别为cpu
、gpu
、dcu
以及对应的节点数量、状态等信息squeue
查看作业队列情况sbatch <job_script.sh>
提交作业scancel <job_id>
取消作业sacct -u <username>
查看作业历史srun
直接提交和执行作业salloc
申请资源并进入交互式模式,详见交互式资源