GPU 모델,
클릭 한 번에 NPU로.

코드 변경 없이, 학습한 그대로 서빙합니다.

NPUOps

파인튜닝부터 NPU 서빙까지,
한 플랫폼에서 끝.

Lab 환경에서 UI 기반 파인튜닝을 진행하고, 양자화 → 컴파일 → 모델 레지스트리 자동 저장 → 검증 → 서빙 배포까지 끊김 없이 이어집니다. GPU·ATOM·RNGD 등 다양한 가속기를 단일 인터페이스로 운영하세요.

모델 컴파일 가이드 →
Airgap

보안 규정 타협은 없습니다.
폐쇄망 단일 명령 설치.

CNI, 서비스 메시, 인증, 모니터링 등 운영에 필요한 모든 인프라를 단일 번들로 압축합니다. USB/전용망으로 옮긴 뒤 단일 명령어 한 번으로 완벽하게 독립적인 설치가 끝납니다.

설치 가이드 →
Compliance

공공기관 수준 보안.
RBAC · 감사 로그 기본 탑재.

Keycloak 기반 RBAC으로 역할별 권한을 엄격히 분리하고, 누가·언제·어떤 작업을 했는지 감사 로그로 전 이력을 기록합니다. 공공·금융·국방·의료 컴플라이언스 요건에 즉시 대응합니다.

감사 로그 →
NPU vs GPU

전성비, 데이터로 증명하세요.

동일 모델을 NPU·GPU에 각각 서빙하고 Performance/Watt를 포함한 핵심 지표를 하나의 대시보드에서 직접 비교합니다. 경영진을 위한 정량적 NPU 도입 근거를 즉시 확보하세요.

모니터링 가이드 →
Documentation

문서로 시작하기.

NuFi의 모든 기능과 운영 가이드를 문서에서 찾아보세요.

FAQ

자주 묻는 질문.

도입 전 가장 많이 받는 질문을 모았습니다.

NuFi는 정확히 어떤 플랫폼인가요?

NuFi는 Kubernetes 기반의 NPUOps 플랫폼입니다. 모델 파인튜닝, 양자화, 컴파일, NPU 포팅, 서빙, 모니터링까지 AI 모델 운영의 전 과정을 하나의 환경에서 처리할 수 있도록 설계되었습니다. GPU·ATOM·RNGD 등 다양한 가속기를 단일 인터페이스로 관리하며, 공공기관 수준의 보안 요건과 폐쇄망(Airgap) 운영을 모두 만족합니다.

인터넷이 차단된 폐쇄망(Airgap) 환경에서도 설치할 수 있나요?

네. NuFi는 CNI, 서비스 메시, 인증, 모니터링 등 운영에 필요한 모든 인프라를 단일 번들로 압축해 제공합니다. USB나 전용망을 통해 폐쇄망 서버로 옮긴 뒤 단일 명령어로 설치를 완료할 수 있어, 외부 인터넷 의존도가 0%인 환경에서도 동일한 사용 경험을 제공합니다.

지원하는 NPU/GPU 하드웨어는 어떤 것이 있나요?

GPU(NVIDIA), ATOM, RNGD를 기본 지원합니다. 공식 지원되지 않는 디바이스도 수동 등록을 통해 NuFi의 스케줄링·모니터링·서빙 기능을 사용할 수 있습니다. 새로운 가속기 도입 시에도 플랫폼 교체 없이 통합 운영이 가능합니다.

기존 MLOps 도구(MLflow 등)와 연동되나요?

네. NuFi는 MLflow 등 주요 MLOps 도구와의 연동을 지원합니다. 기존 학습 파이프라인을 유지한 채로 학습된 모델을 NuFi 모델 레지스트리로 가져와 양자화 → 컴파일 → NPU 서빙까지 끊김 없이 이어갈 수 있습니다. 기존 MLOps 투자를 보호하면서 NPU 운영을 추가할 수 있습니다.

NPU 포팅(양자화·컴파일)도 NuFi 안에서 처리되나요?

네. Lab 환경에서 UI 기반 파인튜닝을 진행한 뒤 양자화 → 컴파일 → 모델 레지스트리 자동 저장 → 모델 검증 → 서빙 배포까지 플랫폼 내에서 완결됩니다. 별도의 컴파일 환경을 직접 구축하거나 사람이 매번 수동 변환할 필요가 없습니다.

NPU와 GPU의 전성비를 정량적으로 비교할 수 있나요?

네. 동일 모델을 NPU와 GPU에 각각 서빙하고 Performance/Watt를 포함한 핵심 지표를 대시보드에서 직접 비교할 수 있습니다. NPU 도입 효과를 경영진에게 설득하기 위한 정량 데이터를 별도 측정 환경 없이 즉시 확보할 수 있습니다.

RBAC, 감사 로그 등 공공기관 보안 요건을 만족하나요?

네. NuFi는 Keycloak 연동 RBAC으로 역할별 권한을 엄격히 분리하고, 인프라 관리자만 민감 기능에 접근할 수 있도록 제어합니다. 또한 누가·언제·어떤 작업을 수행했는지 모든 이력을 감사 로그(Audit Log)로 기록하므로, 공공·금융·국방·의료 분야의 보안 컴플라이언스 요건에 즉시 대응할 수 있습니다.

장애가 발생했을 때 어떤 디바이스/Pod이 문제인지 빠르게 찾을 수 있나요?

NuFi UI에서 클러스터부터 개별 디바이스의 온도·전력·사용률을 한눈에 확인할 수 있고, 각 디바이스에 점유 중인 Pod 이름이 직접 표시되어 문제 지점을 즉시 추적할 수 있습니다. 수많은 장치 사이에서 장애 원인을 추적하는 데 들이던 시간을 크게 단축합니다.

사내 문서 기반 RAG 챗봇도 NuFi로 구축할 수 있나요?

네. NuFi는 단순 툴 제공을 넘어, 도메인 전문가 기반 데이터 설계 컨설팅(NuFi’s Way),Agent AI 기반 지능형 ETL, 단일 설정 기반 즉시 배포를 제공합니다. ETL·Vector DB·Agent·UI 서버를 직접 조립할 필요 없이, 설정 한 번으로 사내 문서 기반 RAG 서비스를 즉시 운영할 수 있습니다. 보안 규정으로 외부 AI를 쓸 수 없는 조직에 특히 적합합니다.

Kubeflow 같은 MLOps 오픈소스나 NPU 벤더 솔루션과 무엇이 다른가요?

Kubeflow 등 MLOps 오픈소스는 NPU 서빙·양자화·컴파일을 직접 지원하지 않아 별도 구성이 필요하고, NPU 벤더 솔루션은 자사 칩 전용 서빙 레이어에 그칩니다. NuFi는 다양한 NPU 지원 + 양자화·컴파일·포팅 완결 + MLOps 연동 + 폐쇄망 단일 번들 설치 + RBAC/감사 로그를 하나의 플랫폼에서 제공한다는 점이 가장 큰 차이입니다.

도입 문의나 데모 신청은 어떻게 하나요?

상단의 데모 신청 버튼을 통해 문의해 주세요. 운영 환경(온프레미스/폐쇄망/클라우드), 보유 가속기, 목표 워크로드를 알려주시면 환경에 맞춘 PoC 가이드를 제공해 드립니다.

답을 찾지 못하셨나요?문의하기 →