본문으로 건너뛰기

모니터링하기

클러스터 전체 리소스 현황과 GPU/NPU 디바이스 상태를 확인하는 방법을 안내합니다.

좌측 사이드바에서 Monitoring 메뉴를 클릭하면 시스템 모니터링 정보가 표시됩니다.

모니터링

Cluster Overview

클러스터 전반의 평균 리소스 사용량을 카드와 시계열 그래프로 표시합니다.

우측 상단의 시간 버튼(1h / 6h / 24h / 7d)으로 시계열 그래프 범위를 조절할 수 있습니다.

모니터링 클러스터

카드설명
CPU클러스터 노드 평균 CPU 사용률
Memory클러스터 노드 평균 메모리 사용률
Disk클러스터 노드 디스크 사용률
시계열 그래프위 정보들에 대한 시계열 그래프

Device Overview

GPU/NPU 가속기 현황을 표시합니다.

모니터링 Device

항목설명
가속기 종류별 Overview전체 / 할당 / 미할당 개수 및 평균 사용률
가속기 종류 필터가속기 종류별 필터
가속기 할당 상태 필터가속기 할당 상태에 따른 필터
노드 카드노드별 CPU / Memory / Disk 사용률 및 설치된 가속기 정보
디바이스 카드개별 디바이스의 Usage / Temp / Power / VRAM 사용률, 할당된 Pod 정보

노드 카드 또는 디바이스 카드를 클릭하면 해당 항목의 시계열 그래프를 확인할 수 있습니다.

해당 노드의 CPU / Memory / Disk 시계열 그래프가 표시됩니다.

노드 상세 그래프