BRAG
← 포럼으로
Ggyak
작성자

Sakana AI Fugu Ultra 분석 — 단일 모델 없이 Fable 5급 벤치마크 달성한 비결

ai_vibe4분 읽기· 2026년 6월 26일 PM 2:34· 👁 63

도쿄 스타트업 Sakana AI가 여러 LLM을 동적으로 조율하는 Fugu Ultra로 Fable 5·Mythos Preview와 대등한 벤치마크 성능을 기록했다. 단일 모델 훈련 없이 ICLR 2026 논문 기반 오케스트레이션 기술로 GPT-5.5를 웃도는 결과를 낸 전략과 한계를 정리한다.

🎴 카드뉴스8
AI VIBE · Sakana AI
대부분이 모르는 새로운 AI 전략
Fugu Ultra
모델을 훈련하지 않고도 Fable 5급 성능을 낸다
그리고 더 놀라운 건...
Fugu가 뭔지 아시나요?
복어(Fugu)처럼 여러 AI를 한 몸처럼 묶어 쓰는 시스템 단일 OpenAI 호환 API처럼 보이지만 내부엔 수십 개 LLM이 움직인다
ICLR 2026 논문 기반 기술
어떻게 작동하나
TRINITY + Conductor
TRINITY: Thinker·Worker·Verifier 역할을 태스크마다 다른 모델에 배분 Conductor: 강화학습으로 모델들이 자연어로 협력하는 전략을 발견
Sakana 자체 발표 수치
벤치마크 성적표
SWE-Bench Pro 73.7 (Fable 5: 80.0) GPQA-Diamond 95.5 (Gemini 3.1: 94.3) LiveCodeBench 93.2 (GPT-5.5: 85.3) MRCRv2 93.6
실제 써봤더니...
숫자와 현실의 온도 차
Ethan Mollick: "믿을 수 없이 느림 코딩 테스트 30분 소요" $20 플랜 → 프롬프트 1개로 5시간 할당량 소진
요금 구조
얼마에 쓸 수 있나
구독: Standard $20 / Pro $100 / Max $200 Pay-as-you-go: 입력 $5/M · 출력 $30/M 7월 전 가입 시 1개월 무료 추가 EU/EEA는 아직 미지원
전략적 포지셔닝
벤더 락인 탈출구 될 수 있을까
특정 공급자 모델 제외 가능 → 데이터 거주지·컴플라이언스 대응 단, 업스트림 이용약관 법적 회색지대 독립 벤치마크 검증도 아직 없음
어떻게 생각하세요? 댓글 👇
오케스트레이션이 단일 모델을 대체할까
brag.io.kr
성능은 올라가도 속도·비용·법적 리스크 세 가지를 동시에 풀어야 실용화된다 여러분은 어떻게 보시나요?
1 / 8
스와이프 · 점을 눌러 이동

💬 댓글 0

0/500

댓글을 불러오는 중…