常见问题 
以下是用户在使用集群过程中经常遇到的问题及解决方法。
1. FTP 相关 
Q:为什么我用 FTP 访问集群时无法连接?
 A:请检查自己的环境配置文件 .bashrc(默认路径 ~/.bashrc)是否进行了修改。如果修改过,请先恢复为默认配置后再测试。
Q:默认的 .bashrc 配置是什么样的?
 A:如下所示:
bash
# .bashrc
# Source global definitions
if [ -f /etc/bashrc ]; then
    . /etc/bashrc
fi
# User specific environment
if ! [[ "$PATH" =~ "$HOME/.local/bin:$HOME/bin:" ]]
then
    PATH="$HOME/.local/bin:$HOME/bin:$PATH"
fi
export PATH
# Uncomment the following line if you don't like systemctl's auto-paging feature:
# export SYSTEMD_PAGER=
# User specific aliases and functions2. 环境配置相关 
Q:能不能在 .bashrc 文件里直接放多个 source 命令?
 A:不建议这样做。多个 source 文件可能会修改相同的环境变量(如 PATH),容易导致环境冲突。
Q:那程序需要的环境应该怎么配置?
 A:推荐为每个程序单独写一个 .sh 脚本,在提交 Slurm 任务时在脚本中 source 对应的环境即可。这样可以避免不同软件环境之间的干扰。
3. 作业排队 
Q:为什么我的作业一直在排队(PD 状态)?
 A:
- 检查提交的分区(partition)是否正确;
- 确认所申请的资源是否超出队列限制;
- 当前资源可能正在被其他任务占用,请耐心等待。
4. 作业报错 
Q:作业运行时报错 “Out Of Memory” 怎么办?
 A:
- 增加提交脚本中的内存申请(如 #SBATCH --mem=64G);
- 或尝试减少任务规模。
5. 缓存不足 
Q: 程序运行时报错 No space left on device 是什么意思?
 A: 表示程序在写临时文件时,目标存储目录(通常是计算节点本地 /tmp 或 /ram/tmp)已经被占满,无法继续写入。
 常见的报错形式:
bash
No space left on device
segmentation violationQ: 出现这种情况该怎么解决?
 A:
- 在 Slurm 脚本中手动指定临时目录,避免写到节点本地 - /tmp:bash- export TMPDIR=/lustre1/tmp/$USER/$SLURM_JOB_ID mkdir -p $TMPDIR
- 任务结束后清理临时目录: bash- rm -rf $TMPDIR- 这样可以避免节点本地缓存不足导致的任务崩溃问题。 
👉 如果以上问题未能解决,请参考 问题反馈 页面获取更多帮助。