NuFi란?
NuFi는 NPU(Neural Processing Unit) 기반 AI 모델 서빙을 위한 Kubernetes 네이티브 플랫폼입니다.
MLOps가 GPU 기반 모델 개발·운영 전 과정을 다루듯, NuFi는 NPUOps — NPU 기반 AI 모델의 학습부터 서빙까지 전 과정을 다루는 운영 체계를 실현합니다.
해결하는 문제
- 학습이 끝나도 서빙 환경 세팅에 별도의 시간이 필요
- Kubeflow 같은 MLOps 플랫폼을 쓰려면 Kubernetes를 깊이 알아야 함
- NPU를 도입하고 싶지만 학습부터 서빙까지 이어지는 풀스택 플랫폼이 없음
- 보안 규정상 외부 인터넷이 차단된 폐쇄망 환경에서 AI 플랫폼 도입이 불가능
- 서비스 장애 발생 시 어떤 장치에서 문제가 발생했는지 파악하는 데 시간이 걸림
NPUOps 파이프라인
파인튜닝 → 양자화 → NPU 컴파일 → 서빙 배포 → 운영 & 모니터링
NuFi는 이 파이프라인 전 과정을 하나의 플랫폼 안에서 완결합니다. 학습 환경과 서빙 환경이 동일한 스토리지를 공유하여, 학습이 끝난 순간 별도 이동 없이 즉시 배포가 가능합니다.
지원 디바이스
| 벤더 | 디바이스 |
|---|---|
| NVIDIA | CUDA 지원 GPU |
| Rebellions | ATOM |
| FuriosaAI | RNGD |