集群基本命令 
前提条件
集群操作主要通过 命令行界面(CLI) 与系统交互。本手册假定您具备基本的 Linux 使用经验。
如果您对 Linux 不太熟悉,可以先查看下方的 基础操作命令 部分,帮助快速上手。
Linux 基础操作命令
- 查看文件和目录
bash
ls             #显示当前目录下的文件和文件夹
ls -l          #显示详细信息(权限、大小、时间)
ls -a          #显示所有文件(包括隐藏文件)- 切换目录
bash
cd lustre1      #进入lustre1文件夹
cd ..           #返回上一级目录
cd ../..        #添加斜杠可连续改变目录层级
cd ~            #返回个人目录- 显示当前所在路径
bash
pwd             #输出当前目录的绝对路径- 创建与删除目录
bash
mkdir mydir     #新建目录
rmdir mydir     #删除空目录
rm -r dirname   #递归删除目录及其内部的所有文件/子目录
rm -rf dirname  #强制删除,不会提示确认,直接清空,要格外小心- 复制与移动文件
bash
cp file1 file2    #复制文件  
mv file1 newfile  #移动或重命名文件- 删除文件
bash
rm filename      #删除文件- 文件内容查看
bash
cat filename      # 一次性输出整个文件内容
less filename     # 分页查看(空格翻页,q退出)
head filename     # 查看文件开头 10 行
tail filename     # 查看文件结尾 10 行- 系统与用户信息
bash
whoami            # 查看当前用户
w                 # 查看当前有哪些用户登录Slurm 作业调度命令 
集群采用 Slurm 作业调度系统,以下为常用命令:
提交作业 
bash
sbatch job.srp    #提交一个作业脚本 job.srpTIP
- 集群默认生成的作业脚本扩展名为 .srp,但 Slurm 并不限制脚本后缀。用户也可使用 .slurm、.sbatch 或 .sh。
- 区别仅在于习惯和可读性,不影响脚本提交
查看作业队列 
bash
squeue            #显示当前所有正在排队和运行的作业信息
sq                #仅查看自己提交的作业取消作业 
bash
scancel 作业ID     #取消指定作业查看作业历史 
bash
sacct              #显示作业的运行记录和状态 
sacct -j 作业ID    #查看指定作业的详细信息查看配额 
bash
showqos            #查看集群里所有已配置的 QOS (Quality of Service, 服务质量策略)小技巧 
- Tab 补全:按下 Tab键可自动补全命令或文件名。
- 命令历史:按上下方向键可以翻阅历史输入。
- 强制终止:运行中卡住时可按 Ctrl + C终止命令。