Devices
관리자는 대시보드 UI에서 가속기 디바이스를 직접 추가·수정·삭제할 수 있습니다. 기본 제공 디바이스(gpu, rngd, rbln)는 조회만 가능하며 수정·삭제할 수 없습니다.
이 메뉴는 nufi-admin 역할이 부여된 계정에서만 표시됩니다.
사전 조건
커스텀 디바이스를 등록하기 전에 NuFi가 배포된 Kubernetes 클러스터에 다음 두 가지가 설치되어 있어야 합니다.
설치 여부는 다음 명령으로 확인할 수 있습니다.
# Device Plugin 설치 확인 — 노드 Capacity에 커스텀 리소스 키가 등록되어 있어야 합니다.
kubectl describe node <node-name> | grep -i <resource-key>
# e.g. kubectl describe node <node-name> | grep -i nvidia.com/gpu
# Metric Exporter 설치 확인 — Prometheus에서 메트릭이 수집되고 있어야 합니다.
kubectl get pods -A | grep -i exporter
| 구성 요소 | 역할 |
|---|---|
| Device Plugin | nvidia.com/gpu 등 커스텀 리소스를 Kubernetes 노드 Capacity에 등록. NuFi가 해당 리소스 키로 Pod를 스케줄링할 수 있게 함 |
| Metric Exporter | DCGM Exporter 등 Prometheus 메트릭을 수집하여 모니터링 대시보드에 사용률·온도·전력·메모리 데이터를 제공 |
디바이스 등록 시 입력한 Resource Key를 kubectl describe node로 클러스터 노드 Capacity에서 실제로 조회합니다. 클러스터에 해당 리소스가 존재하지 않으면 등록이 거부됩니다. Device Plugin이 정상 설치된 후에 디바이스를 등록하세요.
디바이스 목록
좌측 사이드바의 Admin > Devices 항목을 클릭합니다.

목록에서 디바이스 행을 클릭하면 해당 디바이스의 상세 페이지로 이동합니다. Edit 또는 Delete 버튼을 클릭한 경우에는 상세 페이지로 이동하지 않고 각 액션이 실행됩니다.
컬럼
| 컬럼 | 설명 |
|---|---|
| Label | 대시보드에 표시되는 이름 |
| Resource Key | Kubernetes 리소스 요청 키 (예: nvidia.com/gpu) |
| Vendor | 제조사 |
| Type | Built-in(기본 제공) 또는 Custom(관리자 추가) 배지 |
액션 버튼
| 버튼 | 대상 | 설명 |
|---|---|---|
| Edit | Custom 디바이스 | 디바이스 정보 수정 |
| Delete | Custom 디바이스 | 디바이스 삭제 (Built-in 디바이스는 불가) |
디바이스 상세
디바이스 상세 페이지에서는 선택한 디바이스의 설정값을 읽기 전용으로 확인할 수 있습니다. 페이지 상단에는 디바이스 이름, Built-in 또는 Custom 배지, 목록으로 돌아가는 버튼이 표시됩니다.

기본 정보
| 항목 | 설명 |
|---|---|
| Device Key | 디바이스 고유 키 |
| Resource Key | Kubernetes 리소스 요청 키 |
| Device Name | 대시보드에 표시되는 디바이스 이름 |
| Vendor Name | 제조사 이름 |
| Memory Name | 디바이스 메모리 유형 레이블 |
모니터링 설정
| 항목 | 설명 |
|---|---|
| Node Label | 노드를 식별하는 Prometheus 레이블 키 |
| Device Label | 디바이스를 식별하는 Prometheus 레이블 키 |
| Pod Label Key | 디바이스가 할당된 Pod를 식별하는 레이블 키. 값이 없으면 표시되지 않습니다. |
| Namespace Label Key | 디바이스가 할당된 Namespace를 식별하는 레이블 키. 값이 없으면 표시되지 않습니다. |
| Utilization | 가속기 사용률 메트릭 이름 |
| Memory | 메모리 계산 모드, 메모리 단위, Used 메트릭, Total 또는 Free 메트릭 |
| Temperature | 온도 메트릭 이름. 값이 없으면 표시되지 않습니다. |
| Power | 전력 메트릭 이름. 값이 없으면 표시되지 않습니다. |
Memory 항목은 등록된 계산 방식에 따라 Used & Total 또는 Used & Free 배지로 표시되며, 메모리 단위도 함께 표시됩니다.
커스텀 디바이스 추가 / 수정
목록 페이지에서 Create 또는 Edit 버튼을 클릭하면 3단계 Wizard가 시작됩니다.
nvidia.com/gpu)를 활용합니다.- Step 1. 기본 정보
- Step 2. 모니터링 설정
- Step 3. 확인

| 필드 | 설명 |
|---|---|
| Device Key | 디바이스 고유 키 (소문자, 숫자, 하이픈). 수정 시 변경 불가 |
| Resource Key | Kubernetes 노드 리소스 키 (예: nvidia.com/gpu). 입력 완료 시 kubectl describe node로 클러스터 감지 여부 자동 확인 |
| Device Name | 대시보드 표시명. Vendor Name과 띄어쓰기로 결합되어 출력됩니다. |
| Vendor Name | 제조사 이름. Device Name과 띄어쓰기로 결합되어 출력됩니다. |
| Memory Name | 디바이스 메모리 유형 레이블 (예: VRAM) |

Prometheus PromQL 기반 메트릭을 설정합니다.
Prometheus Labels
| 필드 | 설명 |
|---|---|
| Node Label | 노드를 식별하는 Prometheus 레이블 키 |
| Device Label | 디바이스를 식별하는 레이블 값 |
| Pod Label Key | Pod를 식별하는 레이블 키 |
| Namespace Label Key | Namespace를 식별하는 레이블 키 |
Metric Expressions
| 필드 | 설명 |
|---|---|
| Utilization | 가속기 사용률(%) PromQL 메트릭명 |
| Memory | 메모리 사용량 PromQL. 모드 선택 후 메트릭명 입력 |
| Memory Unit(단위) | 메모리 값 단위 (bytes / KiB / MiB / GiB) |
| Temperature | 온도(°C) PromQL. 비어있으면 온도 기반 제어 비활성화 |
| Power | 전력(W) PromQL. 비어있으면 미지원으로 처리 |
메모리 모드
| 모드 | 수식 |
|---|---|
| Used / Total | used / total * 100 |
| Used / (Used + Free) | used / (used + free) * 100 |

입력한 디바이스 정보를 최종 확인합니다. 각 섹션의 수정 버튼으로 해당 단계로 돌아가 수정할 수 있습니다. 저장 버튼을 클릭하면 디바이스가 등록됩니다.