본문으로 건너뛰기

커스텀 디바이스 관리

관리자는 대시보드 UI에서 가속기 디바이스를 직접 추가·수정·삭제할 수 있습니다. 기본 제공 디바이스(gpu, rngd, rbln)는 조회만 가능하며 수정·삭제할 수 없습니다.

관리자 전용

이 메뉴는 nufi-admin 역할이 부여된 계정에서만 표시됩니다.

사전 조건

커스텀 디바이스를 등록하기 전에 NuFi가 배포된 Kubernetes 클러스터에 다음 두 가지가 설치되어 있어야 합니다.

설치 여부는 다음 명령으로 확인할 수 있습니다.

# Device Plugin 설치 확인 — 노드 Capacity에 커스텀 리소스 키가 등록되어 있어야 합니다.
kubectl describe node <node-name> | grep -i <resource-key>
# e.g. kubectl describe node <node-name> | grep -i nvidia.com/gpu

# Metric Exporter 설치 확인 — Prometheus에서 메트릭이 수집되고 있어야 합니다.
kubectl get pods -A | grep -i exporter
구성 요소역할
Device Pluginnvidia.com/gpu 등 커스텀 리소스를 Kubernetes 노드 Capacity에 등록. NuFi가 해당 리소스 키로 Pod를 스케줄링할 수 있게 함
Metric ExporterDCGM Exporter 등 Prometheus 메트릭을 수집하여 모니터링 대시보드에 사용률·온도·전력·메모리 데이터를 제공
Resource Key 검증

디바이스 등록 시 입력한 Resource Keykubectl describe node로 클러스터 노드 Capacity에서 실제로 조회합니다. 클러스터에 해당 리소스가 존재하지 않으면 등록이 거부됩니다. Device Plugin이 정상 설치된 후에 디바이스를 등록하세요.


디바이스 목록

좌측 사이드바의 Admin > Devices 항목을 클릭합니다.

Admin Devices 목록

컬럼

컬럼설명
Key디바이스 식별 키 (예: gpu, rbln)
Label대시보드에 표시되는 이름
Vendor제조사
Resource KeyKubernetes 리소스 요청 키 (예: nvidia.com/gpu)
TypeBuilt-in(기본 제공) 또는 Custom(관리자 추가) 배지

액션 버튼

버튼대상설명
① Add Device전체커스텀 디바이스 추가 Wizard 시작
② EditCustom 디바이스디바이스 정보 수정
③ DeleteCustom 디바이스디바이스 삭제 (Built-in 디바이스는 불가)

커스텀 디바이스 추가 / 수정

목록 페이지에서 + Add Device 또는 Edit 버튼을 클릭하면 3단계 Wizard가 시작됩니다.

아래 예시는 클러스터에 설치된 NVIDIA GPU(nvidia.com/gpu)를 활용합니다.

Step 1. 기본 정보

필드설명
Key디바이스 고유 키 (소문자, 숫자, 하이픈). 수정 시 변경 불가
Resource KeyKubernetes 노드 리소스 키 (예: nvidia.com/gpu). 입력 완료 시 kubectl describe node로 클러스터 감지 여부 자동 확인
Label대시보드 표시명
Vendor제조사 이름
Mem Label메모리 표시 단위 레이블 (예: VRAM)

다음 단계