본문으로 건너뛰기
버전: Next

빠른 시작

이 가이드에서는 NuFi에 처음 로그인한 뒤 AI 모델을 배포하고 테스트하는 전 과정을 5단계로 안내합니다.

소요 시간: 약 10분 (모델 로딩 시간 제외)


사전 조건

빠른 시작을 진행하기 전에 다음 조건을 확인하세요.

조건확인 방법
NuFi 설치 완료관리자에게 문의하거나 설치 가이드 참고
대시보드 접근 가능브라우저에서 NuFi 대시보드 URL 접속 확인
계정 발급 완료관리자로부터 로그인 계정(이메일) 수령

1단계: 로그인

대시보드 로그인

우측 상단의 ① Login 버튼을 클릭합니다. OAuth 기반 인증을 지원합니다.

로그인 후 상단 헤더에 프로젝트 선택 드롭다운이 활성화됩니다.


2단계: 프로젝트 생성

프로젝트는 리소스 격리 단위입니다. Lab, Serving, Volume은 모두 프로젝트 단위로 관리됩니다.

프로젝트 생성

  1. 상단 헤더의 ② New Project 버튼을 클릭합니다.
  2. 프로젝트 이름을 입력합니다.
    • 소문자, 숫자, 하이픈(-) 사용 / 3자 이상 (예: my-first-project)
  3. Create 버튼을 클릭합니다.

생성된 프로젝트가 드롭다운에 자동으로 선택됩니다.


3단계: 모델 배포

좌측 사이드바에서 Serving을 클릭합니다.

Serving 목록

  1. ① Create 버튼을 클릭합니다.
  2. Step 1 — 기본 정보를 입력합니다.
    • Service Name: 배포 이름 (예: llm-demo)
    • Service Template: 사용할 추론 프레임워크 선택 (예: vLLM)
  3. 다음 버튼을 클릭하고 Step 2 — 상세 설정으로 이동합니다.
    • Image: 추론 서버 컨테이너 이미지 선택
    • Accelerator Type / Count: 사용할 GPU 또는 NPU 선택
    • vLLM 사용 시 Model 필드에 Huggingface 모델 이름 입력
  4. 다음 버튼을 클릭하고 Step 3 — 리뷰 & 배포에서 설정을 확인합니다.
  5. 배포 버튼을 클릭합니다.

Serving 목록으로 돌아오면 상태가 Pending → Running으로 변경됩니다. 모델 로딩까지 수 분이 소요될 수 있습니다.


4단계: Playground에서 테스트

상태가 Running이 되면 좌측 사이드바의 Playground를 클릭합니다.

  1. 패널 상단 드롭다운에서 방금 배포한 Serving를 선택합니다.
  2. 하단 입력창에 메시지를 입력하고 Send 버튼을 클릭합니다.
  3. 스트리밍으로 모델 응답을 확인합니다.

+ 버튼으로 패널을 추가하면 여러 Serving를 나란히 놓고 응답을 비교할 수 있습니다.


5단계: API 엔드포인트 확인

배포된 모델은 OpenAI 호환 API 엔드포인트를 제공합니다.

Serving 목록

② Connect 버튼을 클릭하면 엔드포인트 URL을 확인할 수 있습니다.

엔드포인트 URL은 https://<host>/<project>/<deployment-name> 형식입니다. 이 URL 뒤에 추론 프레임워크의 API 경로(예: /v1/chat/completions)를 붙여 요청합니다.

curl -X POST 'https://<deployment-endpoint>/v1/chat/completions' \
-H 'Content-Type: application/json' \
-H 'Authorization: Bearer <token>' \
-d '{
"model": "<model-name>",
"messages": [{"role": "user", "content": "안녕하세요"}]
}'