본문으로 건너뛰기
버전: Next

모델 등록

볼륨에 저장된 모델 파일을 NuFi에 등록하여 컴파일·평가·서빙에서 사용할 수 있도록 합니다.


방법 A: 직접 다운로드한 모델 등록

03. 모델 다운로드에서 볼륨에 다운로드한 모델을 등록하는 방법입니다.

1. 모델 등록 메뉴 이동

좌측 사이드바에서 Resources > Models를 클릭하고 Register Model 버튼을 누릅니다.

Models 목록

2. 모델 정보 입력

모델 등록 폼

필드예시 값설명
Model Nameqwen-instruct-tutorial모델 식별 이름
Description-모델 설명 (선택)
Author-작성자 (선택)

3. 아티팩트 추가

모델 등록 후 목록에서 등록한 모델을 클릭하여 상세 화면으로 이동합니다. Add Version 버튼을 클릭하여 아티팩트를 추가합니다.

모델 상세 화면

아티팩트 추가

필드설명
Version아티팩트 버전
Volume모델 파일이 저장된 볼륨 선택
Path볼륨 내 모델 파일 경로. 입력창 옆 폴더 아이콘을 클릭하면 경로 목록이 표시되며, 선택 버튼을 누르면 하단 Validate 버튼이 활성화됨
Format모델 포맷 (예: SafeTensors)
Description버전 설명 (선택)
Author작성자 (선택)

Validate 버튼이 초록색으로 활성화되면 등록 버튼을 클릭합니다.

4. 등록 확인

Models 목록에서 등록한 모델을 클릭하면 추가된 아티팩트를 확인할 수 있습니다.

Models 목록 — 등록 완료


방법 B: NFS 경로의 모델 등록

NAS에 이미 모델 파일이 있는 경우, NFS 볼륨을 연결하여 바로 등록하는 방법입니다.

사전 조건

01. 볼륨 생성에서 NAS 경로가 연결된 NFS 볼륨이 생성되어 있어야 합니다.

1, 2단계는 방법 A와 동일합니다. Model Name은 qwen-instruct-tutorial-nfs로 입력합니다.

3. 아티팩트 추가

방법 A와 동일하게 진행하되, Volume에서 NFS 볼륨(tutorial-volume-nfs)을 선택합니다.

아티팩트 추가 — NFS

4. 등록 확인

추가된 아티팩트를 확인할 수 있습니다.


방법 C: MLflow Integration

MLflow Tracking Server에 등록된 모델을 NuFi로 가져오는 방법입니다.

MLflow에서 실험을 진행하고 mlflow.log_model() 등으로 모델을 등록해 두었다면, NuFi의 MLflow Integration 기능으로 해당 모델을 볼륨에 다운로드하고 바로 등록할 수 있습니다. MLflow UI에서 모델의 Tracking URI, 모델명, 버전을 미리 확인해 두세요.

사전 조건

MLflow 서버가 NuFi 클러스터 내에서 접근 가능해야 합니다.

1. MLflow Integration 메뉴 이동

좌측 사이드바에서 Resources > Models를 클릭하고 Integration 버튼을 누릅니다. Add Webhook 버튼을 클릭하여 MLflow 정보를 입력합니다.

MLflow Webhook 등록

2. MLflow 정보 입력

필드예시 값설명
Nametutorial-webhookWebhook 이름
MLflow URLhttp://192.168.10.160:5000MLflow Tracking Server 주소
Target ModelQwen2.5-0.5B-InstructMLflow에 등록된 모델명
Storage PVCtutorial-volume모델 파일이 저장될 볼륨
Auto Importtrue모델 버전 생성 시 자동 import 여부

Webhook이 등록되면 Receive URL이 생성됩니다. 이 URL을 복사해 둡니다.

Receive URL 확인

3. MLflow에 Receive URL 등록

Webhook 등록 후, NuFi의 Receive URL을 MLflow에 등록해야 합니다. MLflow에서 모델 버전이 생성될 때 NuFi로 알림을 보내도록 연결합니다.

from mlflow import MlflowClient

client = MlflowClient(tracking_uri="http://192.168.10.160:5000")
webhook = client.create_webhook(
name="tutorial-webhook",
url="https://api.nufi.me/api/v1/models/integration/mlflow/webhooks/11/receive", # Receive URL
events=["model_version.created"],
description="NuFi MLflow model_version.created webhook",
)
print(f"webhook_id={webhook.webhook_id}")
print("[OK] 완료")

4. Integration 완료 확인

MLflow에서 모델이 등록되면 NuFi로 자동으로 가져옵니다. Import Job 상태가 Succeeded로 바뀌면 선택한 볼륨에 모델 파일이 저장되고, Models 목록에 자동으로 등록됩니다.

MLflow Import History


다음 단계

05. NPU 컴파일 — RNGD NPU용 바이너리로 컴파일
07. 모델 서빙 배포 — 컴파일 없이 GPU 서빙만 할 경우