본문으로 건너뛰기
버전: 0.1.0

Devices

관리자는 대시보드 UI에서 가속기 디바이스를 직접 추가·수정·삭제할 수 있습니다. 기본 제공 디바이스(gpu, rngd, rbln)는 조회만 가능하며 수정·삭제할 수 없습니다.

관리자 전용

이 메뉴는 nufi-admin 역할이 부여된 계정에서만 표시됩니다.

사전 조건

커스텀 디바이스를 등록하기 전에 NuFi가 배포된 Kubernetes 클러스터에 다음 두 가지가 설치되어 있어야 합니다.

설치 여부는 다음 명령으로 확인할 수 있습니다.

# Device Plugin 설치 확인 — 노드 Capacity에 커스텀 리소스 키가 등록되어 있어야 합니다.
kubectl describe node <node-name> | grep -i <resource-key>
# e.g. kubectl describe node <node-name> | grep -i nvidia.com/gpu

# Metric Exporter 설치 확인 — Prometheus에서 메트릭이 수집되고 있어야 합니다.
kubectl get pods -A | grep -i exporter
구성 요소역할
Device Pluginnvidia.com/gpu 등 커스텀 리소스를 Kubernetes 노드 Capacity에 등록. NuFi가 해당 리소스 키로 Pod를 스케줄링할 수 있게 함
Metric ExporterDCGM Exporter 등 Prometheus 메트릭을 수집하여 모니터링 대시보드에 사용률·온도·전력·메모리 데이터를 제공
Resource Key 검증

디바이스 등록 시 입력한 Resource Keykubectl describe node로 클러스터 노드 Capacity에서 실제로 조회합니다. 클러스터에 해당 리소스가 존재하지 않으면 등록이 거부됩니다. Device Plugin이 정상 설치된 후에 디바이스를 등록하세요.


디바이스 목록

좌측 사이드바의 Admin > Devices 항목을 클릭합니다.

Admin Devices 목록

목록에서 디바이스 행을 클릭하면 해당 디바이스의 상세 페이지로 이동합니다. Edit 또는 Delete 버튼을 클릭한 경우에는 상세 페이지로 이동하지 않고 각 액션이 실행됩니다.

컬럼

컬럼설명
Label대시보드에 표시되는 이름
Resource KeyKubernetes 리소스 요청 키 (예: nvidia.com/gpu)
Vendor제조사
TypeBuilt-in(기본 제공) 또는 Custom(관리자 추가) 배지

액션 버튼

버튼대상설명
EditCustom 디바이스디바이스 정보 수정
DeleteCustom 디바이스디바이스 삭제 (Built-in 디바이스는 불가)

디바이스 상세

디바이스 상세 페이지에서는 선택한 디바이스의 설정값을 읽기 전용으로 확인할 수 있습니다. 페이지 상단에는 디바이스 이름, Built-in 또는 Custom 배지, 목록으로 돌아가는 버튼이 표시됩니다.

Admin Devices 상세

기본 정보

항목설명
Device Key디바이스 고유 키
Resource KeyKubernetes 리소스 요청 키
Device Name대시보드에 표시되는 디바이스 이름
Vendor Name제조사 이름
Memory Name디바이스 메모리 유형 레이블

모니터링 설정

항목설명
Node Label노드를 식별하는 Prometheus 레이블 키
Device Label디바이스를 식별하는 Prometheus 레이블 키
Pod Label Key디바이스가 할당된 Pod를 식별하는 레이블 키. 값이 없으면 표시되지 않습니다.
Namespace Label Key디바이스가 할당된 Namespace를 식별하는 레이블 키. 값이 없으면 표시되지 않습니다.
Utilization가속기 사용률 메트릭 이름
Memory메모리 계산 모드, 메모리 단위, Used 메트릭, Total 또는 Free 메트릭
Temperature온도 메트릭 이름. 값이 없으면 표시되지 않습니다.
Power전력 메트릭 이름. 값이 없으면 표시되지 않습니다.

Memory 항목은 등록된 계산 방식에 따라 Used & Total 또는 Used & Free 배지로 표시되며, 메모리 단위도 함께 표시됩니다.


커스텀 디바이스 추가 / 수정

목록 페이지에서 Create 또는 Edit 버튼을 클릭하면 3단계 Wizard가 시작됩니다.

아래 예시는 클러스터에 설치된 NVIDIA GPU(nvidia.com/gpu)를 활용합니다.

Step 1. 기본 정보

필드설명
Device Key디바이스 고유 키 (소문자, 숫자, 하이픈). 수정 시 변경 불가
Resource KeyKubernetes 노드 리소스 키 (예: nvidia.com/gpu). 입력 완료 시 kubectl describe node로 클러스터 감지 여부 자동 확인
Device Name대시보드 표시명. Vendor Name과 띄어쓰기로 결합되어 출력됩니다.
Vendor Name제조사 이름. Device Name과 띄어쓰기로 결합되어 출력됩니다.
Memory Name디바이스 메모리 유형 레이블 (예: VRAM)