← 포럼으로

작성자

Sakana AI Fugu Ultra 분석 — 단일 모델 없이 Fable 5급 벤치마크 달성한 비결

ai_vibe4분 읽기· 2026년 6월 26일 PM 2:34· 👁 63

도쿄 스타트업 Sakana AI가 여러 LLM을 동적으로 조율하는 Fugu Ultra로 Fable 5·Mythos Preview와 대등한 벤치마크 성능을 기록했다. 단일 모델 훈련 없이 ICLR 2026 논문 기반 오케스트레이션 기술로 GPT-5.5를 웃도는 결과를 낸 전략과 한계를 정리한다.

🎴 카드뉴스8장

AI VIBE · Sakana AI

대부분이 모르는 새로운 AI 전략

Fugu Ultra

모델을 훈련하지 않고도 Fable 5급 성능을 낸다

그리고 더 놀라운 건...

Fugu가 뭔지 아시나요?

복어(Fugu)처럼 여러 AI를 한 몸처럼 묶어 쓰는 시스템 단일 OpenAI 호환 API처럼 보이지만 내부엔 수십 개 LLM이 움직인다

ICLR 2026 논문 기반 기술

어떻게 작동하나

TRINITY + Conductor

TRINITY: Thinker·Worker·Verifier 역할을 태스크마다 다른 모델에 배분 Conductor: 강화학습으로 모델들이 자연어로 협력하는 전략을 발견

Sakana 자체 발표 수치

벤치마크 성적표

SWE-Bench Pro 73.7 (Fable 5: 80.0) GPQA-Diamond 95.5 (Gemini 3.1: 94.3) LiveCodeBench 93.2 (GPT-5.5: 85.3) MRCRv2 93.6

실제 써봤더니...

숫자와 현실의 온도 차

Ethan Mollick: "믿을 수 없이 느림 코딩 테스트 30분 소요" $20 플랜 → 프롬프트 1개로 5시간 할당량 소진

요금 구조

얼마에 쓸 수 있나

구독: Standard $20 / Pro $100 / Max $200 Pay-as-you-go: 입력 $5/M · 출력 $30/M 7월 전 가입 시 1개월 무료 추가 EU/EEA는 아직 미지원

전략적 포지셔닝

벤더 락인 탈출구 될 수 있을까

특정 공급자 모델 제외 가능 → 데이터 거주지·컴플라이언스 대응 단, 업스트림 이용약관 법적 회색지대 독립 벤치마크 검증도 아직 없음

어떻게 생각하세요? 댓글 👇

오케스트레이션이 단일 모델을 대체할까

brag.io.kr

성능은 올라가도 속도·비용·법적 리스크 세 가지를 동시에 풀어야 실용화된다 여러분은 어떻게 보시나요?

1 / 8

스와이프 · 점을 눌러 이동← → 키 · 화살표 · 점을 눌러 이동

관련 태그

#SakanaAI #FuguUltra #LLM오케스트레이션 #멀티에이전트 #AI벤치마크 #벤더락인

💬 댓글 0

댓글을 불러오는 중…