集群基本命令
前提条件
集群操作主要通过 命令行界面(CLI) 与系统交互。本手册假定您具备基本的 Linux 使用经验。
如果您对 Linux 不太熟悉,可以先查看下方的 基础操作命令 部分,帮助快速上手。
Linux 基础操作命令
- 查看文件和目录
bash
ls #显示当前目录下的文件和文件夹
ls -l #显示详细信息(权限、大小、时间)
ls -a #显示所有文件(包括隐藏文件)
- 切换目录
bash
cd lustre1 #进入lustre1文件夹
cd .. #返回上一级目录
cd ../.. #添加斜杠可连续改变目录层级
cd ~ #返回个人目录
- 显示当前所在路径
bash
pwd #输出当前目录的绝对路径
- 创建与删除目录
bash
mkdir mydir #新建目录
rmdir mydir #删除空目录
rm -r dirname #递归删除目录及其内部的所有文件/子目录
rm -rf dirname #强制删除,不会提示确认,直接清空,要格外小心
- 复制与移动文件
bash
cp file1 file2 #复制文件
mv file1 newfile #移动或重命名文件
- 删除文件
bash
rm filename #删除文件
- 文件内容查看
bash
cat filename # 一次性输出整个文件内容
less filename # 分页查看(空格翻页,q退出)
head filename # 查看文件开头 10 行
tail filename # 查看文件结尾 10 行
- 系统与用户信息
bash
whoami # 查看当前用户
w # 查看当前有哪些用户登录
Slurm 作业调度命令
集群采用 Slurm 作业调度系统,以下为常用命令:
提交作业
bash
sbatch job.srp #提交一个作业脚本 job.srp
TIP
- 集群默认生成的作业脚本扩展名为 .srp,但 Slurm 并不限制脚本后缀。用户也可使用 .slurm、.sbatch 或 .sh。
- 区别仅在于习惯和可读性,不影响脚本提交
查看作业队列
bash
squeue #显示当前所有正在排队和运行的作业信息
sq #仅查看自己提交的作业
取消作业
bash
scancel 作业ID #取消指定作业
查看作业历史
bash
sacct #显示作业的运行记录和状态
sacct -j 作业ID #查看指定作业的详细信息
查看配额
bash
showqos #查看集群里所有已配置的 QOS (Quality of Service, 服务质量策略)
小技巧
- Tab 补全:按下
Tab
键可自动补全命令或文件名。 - 命令历史:按上下方向键可以翻阅历史输入。
- 强制终止:运行中卡住时可按
Ctrl + C
终止命令。