Model Artifacts
MLflow에서 학습된 모델을 NuFi에 등록하고, 버전별 아티팩트를 관리하며, 바로 추론 서비스로 배포할 수 있습니다.
모델은 3계층 구조로 관리됩니다.
| 계층 | 설명 |
|---|---|
| RegisteredModel | 모델 이름 단위의 최상위 그룹 |
| ModelVersion | 모델의 개별 버전. 하나의 모델에 여러 버전을 등록할 수 있습니다. |
| ModelArtifact | 버전에 연결된 실제 파일 경로 (Volume + Path). NPU 컴파일 후 자동 추가되는 rngd 아티팩트 포함 |
사전 조건
- NuFi 프로젝트가 생성되어 있어야 합니다.
- 모델 파일이 저장된 Volume(PVC)이 프로젝트에 마운트 가능한 상태여야 합니다.
- MLflow 연동을 사용하려면 접근 가능한 MLflow Tracking Server가 있어야 합니다.
모델 목록
좌측 사이드바에서 Models를 클릭합니다.

| 번호 | 설명 |
|---|---|
| ① | MLflow Webhook 및 Import History 관리 페이지로 이동합니다 |
| ② | 새 모델 버전을 직접 등록하는 폼으로 이동합니다 |
| ③ | 선택한 모델을 즉시 배포하는 다이얼로그를 엽니다. 버전이 없는 모델은 비활성화됩니다 |
컬럼
| 컬럼 | 설명 |
|---|---|
| Name | 등록된 모델 이름 |
| Versions | 등록된 버전 수 |
| Description | 모델 설명 |
| Created | 최초 등록 시간 |
모델 상세 — 버전 목록
모델 목록에서 모델 행을 클릭하면 버전 목록 페이지로 이동합니다.

| 컬럼 | 설명 |
|---|---|
| Version | 버전 문자열 (예: v1, 1.0.0) |
| State | 버전 상태 (Active 등) |
| Author | 버전 등록자 이름 |
| Source | 버전의 출처 유형 (예: mlflow, manual) |
| Artifacts | 해당 버전에 연결된 아티팩트 수 |
| Description | 버전 설명 |
| Created | 버전 등록 시간 |
버전 목록 상단의 + Add Version 버튼으로 현재 모델에 새 버전을 추가할 수 있습니다.
버전 상세 — 아티팩트 목록
버전 행을 클릭하면 아티팩트 목록 페이지로 이동합니다.

컬럼
| 컬럼 | 설명 |
|---|---|
| Name | 아티팩트 이름 (예: original) |
| Format | 모델 포맷 (예: safetensors, gguf, rngd, other) |
| Platform | 대상 실행 플랫폼 (rngd, gpu 등) |
| URI | 아티팩트 파일 위치 (pvc://{volume}/{path} 형식) |
| Size | 아티팩트 크기 |
| Compilation | 컴파일 결과물 여부 / 연결된 컴파일 정보 |
액션 아이콘
행 우측의 아이콘 4개는 좌측부터 다음과 같습니다.
| 아이콘 | 기능 | 설명 |
|---|---|---|
| Compile | 해당 아티팩트로 NPU 컴파일 작업을 빠르게 실행 | |
| Evaluate | 해당 아티팩트에 대한 평가(Evaluation) 작업 실행 (추후 지원 예정) | |
| Benchmark Submit | 공식 벤치마크에 아티팩트를 출전시켜 결과를 비교 (추후 지원 예정) | |
| Quick Deploy | 해당 아티팩트를 즉시 배포하는 다이얼로그 실행 |
모델 등록
모델은 모델 → 버전 → 아티팩트 3계층으로 구성되며, 다음 순서로 등록합니다.
1. 모델 등록
모델 목록 페이지 우측 상단의 Register Model 버튼을 클릭합니다.

| 필드 | 설명 |
|---|---|
| Model Name | 모델 그룹 이름 (예: llama-3-ko-chat) |
| Description | 모델에 대한 설명 메모 |
| Author | 모델 등록자 이름 |
2. 버전 등록
모델 목록에서 등록한 모델 행을 클릭하여 모델 상세 페이지로 이동한 뒤, + Add Version 버튼을 클릭합니다.

| 필드 | 설명 |
|---|---|
| Version | 버전 문자열 (예: v1, 1.0.0). 같은 모델 내에서 유일해야 합니다. |
| Volume | 모델 파일이 저장된 Volume(PVC) 선택 |
| Path | Volume 내 모델 파일 또는 디렉터리 경로. 입력란 우측의 폴더 아이콘을 클릭하면 선택 가능한 모델 리스트가 표시됩니다. |
| Format | 모델 파일 포맷. Path 입력 완료 시 자동 감지를 시도합니다. |
| Description | 버전에 대한 설명 메모 |
| Author | 버전 등록자 이름 |
3. 아티팩트 등록
버전 목록에서 등록한 버전 행을 클릭하여 버전 상세 페이지로 이동한 뒤, + Add Artifact 버튼을 클릭합니다.

| 필드 | 설명 |
|---|---|
| Artifact Name | 아티팩트 이름 (예: furiosa-rngd) |
| Format | 모델 포맷 (예: safetensors, gguf, rngd) |
| Platform | 대상 실행 플랫폼 (rngd, gpu 등) |
| Volume | 아티팩트 파일이 저장된 Volume(PVC) 선택 |
| Path | Volume 내 아티팩트 파일 또는 디렉터리 경로. 입력란 우측의 폴더 아이콘을 클릭하면 선택 가능한 모델 리스트가 표시됩니다. |
Quick Deploy
모델 목록·버전 목록·아티팩트 목록 어디서든 Quick Deploy () 버튼으로 즉시 배포 다이얼로그를 열 수 있습니다.
진입점별 비활성화 조건
| 진입점 | 비활성화 조건 |
|---|---|
| 모델 목록 | 해당 모델에 버전이 없음 |
| 버전 목록 | 해당 버전에 아티팩트가 없음 |
Quick Deploy 다이얼로그
Quick Deploy 다이얼로그는 모델/버전/아티팩트를 Cascading 드롭다운으로 선택하고, platform에 따라 가속기·추론 엔진·컨테이너 이미지를 자동으로 결정합니다.
| 필드 | 설명 |
|---|---|
| Model | 배포할 모델 선택 |
| Version | 배포할 버전 선택 (모델 선택 후 활성화) |
| Artifact | 배포할 아티팩트 선택 (버전 선택 후 활성화) |
| Service Name | 생성될 Serving 이름 |
| Inference Engine | 추론 엔진 선택 |
| Accelerator | 가속기 선택 |
| Image | 컨테이너 이미지 |
Advanced 섹션 (선택):
| 필드 | 설명 |
|---|---|
| CPU | 컨테이너 CPU 요청량 |
| Memory | 컨테이너 메모리 요청량 |
| 추가 Arguments | 추론 엔진에 전달할 커스텀 인자 (예: --max-model-len 4096) |
| Environment Variables | 컨테이너에 주입할 환경변수 |
MLflow 연동
NuFi는 MLflow와 두 가지 방식으로 연동됩니다.
| 방식 | 설명 |
|---|---|
| Pull (수동 Import) | MLflow Tracking Server의 특정 Run에서 아티팩트를 직접 가져옵니다. |
| Push (Webhook 자동 Import) | MLflow에서 모델이 등록될 때 Webhook으로 NuFi에 자동 전달됩니다. NuFi가 제공하는 Receive URL을 MLflow Webhook으로 등록하면 됩니다. |
Webhook 폼 필드, Receive URL 발급 후 MLflow에 등록하는 방법(MlflowClient.create_webhook 예시 포함), Import History 확인까지 단계별 절차는 튜토리얼: 모델 등록 — 방법 C: MLflow Integration을 참고하세요.
모델 목록 상단의 Integration 버튼을 클릭하면 연동 관리 페이지로 이동합니다.
Integration 페이지

| 버튼 | 설명 |
|---|---|
| ① Import from MLflow | Pull Import 폼으로 이동 |
| ② Add Webhook | 새 Webhook 등록 다이얼로그 실행 |
Webhook 목록 탭에서는 등록된 Webhook의 URL, 상태(Active/Inactive), 최근 수신 이벤트를 확인하고 삭제할 수 있습니다.
Webhook 등록 방법:
- Add Webhook 버튼을 클릭하면 NuFi의 Receive URL이 표시됩니다.
- 표시된 Receive URL을 복사하여 MLflow의 Webhooks 설정에 등록합니다.
- MLflow Webhook 등록 방법은 MLflow Registry Webhooks 문서를 참고하세요.
- 이후 MLflow에서 모델 버전이 등록되면 NuFi에 자동으로 전달됩니다.
Import History 탭에서는 과거 Import 작업의 상태(Pending / Running / Succeeded / Failed)와 로그를 조회할 수 있습니다.
비정상 상태 처리:
| 상태 | 확인 사항 |
|---|---|
| Import Failed | MLflow Tracking URL 및 Run ID가 올바른지 재확인하세요. |
| Webhook Inactive | Webhook 등록 시 입력한 URL이 MLflow에서 접근 가능한지 확인하세요. |
Pull Import 폼

| 필드 | 설명 | 필수 |
|---|---|---|
| MLflow Tracking URL | MLflow Tracking Server 주소 (예: http://mlflow.example.com) | ✓ |
| Run ID | Import할 MLflow Run의 UUID | ✓ |
| Artifact Path (optional) | Run 내 특정 아티팩트 경로. 비워두면 Run 전체를 가져옵니다. | - |
| Target Model | NuFi에서 등록될 모델 이름 | ✓ |
| Target Version | NuFi에서 등록될 버전 문자열 | ✓ |
| Storage PVC | 아티팩트를 저장할 Volume(PVC) 선택 | ✓ |
Import 버튼을 클릭하면 백그라운드 Import 작업이 시작됩니다. 진행 상태는 Integration > Import History 에서 확인할 수 있습니다.