常见问题
以下是用户在使用集群过程中经常遇到的问题及解决方法。
1. FTP 相关
Q:为什么我用 FTP 访问集群时无法连接?
A:请检查自己的环境配置文件 .bashrc
(默认路径 ~/.bashrc
)是否进行了修改。如果修改过,请先恢复为默认配置后再测试。
Q:默认的 .bashrc
配置是什么样的?
A:如下所示:
bash
# .bashrc
# Source global definitions
if [ -f /etc/bashrc ]; then
. /etc/bashrc
fi
# User specific environment
if ! [[ "$PATH" =~ "$HOME/.local/bin:$HOME/bin:" ]]
then
PATH="$HOME/.local/bin:$HOME/bin:$PATH"
fi
export PATH
# Uncomment the following line if you don't like systemctl's auto-paging feature:
# export SYSTEMD_PAGER=
# User specific aliases and functions
2. 环境配置相关
Q:能不能在 .bashrc
文件里直接放多个 source
命令?
A:不建议这样做。多个 source
文件可能会修改相同的环境变量(如 PATH
),容易导致环境冲突。
Q:那程序需要的环境应该怎么配置?
A:推荐为每个程序单独写一个 .sh
脚本,在提交 Slurm 任务时在脚本中 source
对应的环境即可。这样可以避免不同软件环境之间的干扰。
3. 作业排队
Q:为什么我的作业一直在排队(PD 状态)?
A:
- 检查提交的分区(partition)是否正确;
- 确认所申请的资源是否超出队列限制;
- 当前资源可能正在被其他任务占用,请耐心等待。
4. 作业报错
Q:作业运行时报错 “Out Of Memory” 怎么办?
A:
- 增加提交脚本中的内存申请(如
#SBATCH --mem=64G
); - 或尝试减少任务规模。
👉 如果以上问题未能解决,请参考 问题反馈 页面获取更多帮助。