반응형

SLURM 2

SLURM configuration 파일 톺아보기

IT업무를 하면서 배운 가장 큰 교훈 중 하나는 "무슨 일이든 시작 하기 전에 공식 문서 찾아보기" 입니다. 이번 포스팅에서는 slurm conf 파일에 대해서 살펴보는 시간을 가져보겠습니다. (한 번에 모든 값을 다 리뷰하기엔 어려우니 조금씩 업데이트 하겠습니다.) 공식 문서 링크 https://slurm.schedmd.com/slurm.conf.html Slurm Workload Manager - slurm.conf Comma-separated list of resources you wish to track on the cluster. These are the resources requested by the sbatch/srun job when it is submitted. Currently this..

HPC/Scheduler 2023.09.09

SLURM Build

이번 글에서는 HPC에서 많이 사용되는 SLURM 잡 스케줄러를 구축해보려고 한다. slurm은 잡 스케줄러인만큼, 클러스터에 설치되어 대량의 노드에 작업을 배치성 작업을 제출하고 관리하는데 유용하다. slurm을 구성하는 가장 간단한 방법 중 하나를 수행해보고자 한다. 대규모의 slurm cluster를 구성하기 위해서는 많은 구성이 필요하지만 여기서는 하나의 노드에 slurm을 구성하는 것을 시작으로 하여, 규모가 좀 있는 (수~ 수십개의 노드) 클러스터에서는 어떤 구성들이 추가되는 지 하나씩 차근차근 발전시켜 나가보자. 이 글에서는 다음과 같은 환경에서 slurm cluster가 구성된다 설치 환경 - 1개의 Master Node - OS는 Ubuntu 22.04 - CPU 2 Cores, RAM ..

HPC/Scheduler 2023.09.01
반응형