본문으로 건너뛰기

NuFi란?

NuFi는 NPU(Neural Processing Unit) 기반 AI 모델 서빙을 위한 Kubernetes 네이티브 플랫폼입니다.

MLOps가 GPU 기반 모델 개발·운영 전 과정을 다루듯, NuFi는 NPUOps — NPU 기반 AI 모델의 학습부터 서빙까지 전 과정을 다루는 운영 체계를 실현합니다.

해결하는 문제

  • 학습이 끝나도 서빙 환경 세팅에 별도의 시간이 필요
  • Kubeflow 같은 MLOps 플랫폼을 쓰려면 Kubernetes를 깊이 알아야 함
  • NPU를 도입하고 싶지만 학습부터 서빙까지 이어지는 풀스택 플랫폼이 없음
  • 보안 규정상 외부 인터넷이 차단된 폐쇄망 환경에서 AI 플랫폼 도입이 불가능
  • 서비스 장애 발생 시 어떤 장치에서 문제가 발생했는지 파악하는 데 시간이 걸림

NPUOps 파이프라인

파인튜닝 → 양자화 → NPU 컴파일 → 서빙 배포 → 운영 & 모니터링

NuFi는 이 파이프라인 전 과정을 하나의 플랫폼 안에서 완결합니다. 학습 환경과 서빙 환경이 동일한 스토리지를 공유하여, 학습이 끝난 순간 별도 이동 없이 즉시 배포가 가능합니다.

지원 디바이스

벤더디바이스
NVIDIACUDA 지원 GPU
RebellionsATOM
FuriosaAIRNGD