MAI-Thinking-1 출시 — Microsoft 자체 추론 모델, SWE-Bench에서 Claude 4 동급 성능
Microsoft가 독자 개발한 추론 모델 MAI-Thinking-1을 공개했습니다. 35B 활성 파라미터의 희소 혼합 전문가 구조로, AIME 2025 97.0%·SWE-Bench Pro에서 Claude Opus 4 동급 성능을 기록하며 엔터프라이즈 AI 시장에 새로운 도전장을 내밀었습니다.
Microsoft, 자체 추론 AI 모델 MAI-Thinking-1 공개
Microsoft AI가 2026년 5월, 자체 개발 추론 모델 MAI-Thinking-1을 발표했습니다. OpenAI·Anthropic 등 외부 모델에 의존하던 방식을 벗어나 독자 개발 노선을 공식화한 첫 번째 대형 추론 모델입니다.

모델 구조 — 35B 활성, ~1T 전체 파라미터
MAI-Thinking-1은 희소 혼합 전문가(Sparse Mixture of Experts, SMoE) 아키텍처를 채택했습니다.
- 활성 파라미터: 35B (추론 시 실제 사용)
- 전체 파라미터: 약 1조(~1T)
- 컨텍스트 윈도우: 256,000 토큰
- API 호환성: Chat Completions API 지원, 함수 호출(Function Calling) 지원
SMoE 구조 덕분에 전체 파라미터 수(~1T)에 비해 추론 시 메모리 사용량이 훨씬 작습니다. 실질적으로 더 큰 모델들과 경쟁하면서도 운영 비용을 낮출 수 있는 설계입니다.
벤치마크 성능 — AIME 97%, SWE-Bench에서 Claude 동급

Microsoft가 공개한 주요 성능 지표는 다음과 같습니다.
| 벤치마크 | MAI-Thinking-1 |
|---|---|
| AIME 2025 | 97.0% |
| AIME 2026 | 94.5% |
| SWE-Bench Pro | Claude Opus 4 동급 |
| 인간 선호도 평가 | Claude Sonnet 4 선호 수준 |
수학 올림피아드 기반의 AIME 2025에서 97.0%를 기록한 것은 현재 최상위권 추론 모델들과 동일한 수준입니다. 소프트웨어 엔지니어링 벤치마크인 SWE-Bench Pro에서는 Anthropic의 Claude Opus 4와 동등한 성능을 보였습니다.
Hill-Climbing Machine 철학 — 제3자 의존 없는 자립 개발
Microsoft는 이번 모델 개발 철학을 'Hill-Climbing Machine' 이라 명명했습니다. 세 가지 핵심 원칙을 제시했습니다.
- 학습된 능력(Learned Capability): OpenAI·Anthropic 등 제3자 모델의 증류(Distillation) 없이 자체 학습. '의존 지능은 교사의 설계 선택에 얽혀 있다'는 관점에서 독립적 능력 확보를 목표로 합니다.
- 깨끗한 데이터(Clean Data): 추적 가능하고 엔터프라이즈급 데이터 파이프라인 사용.
- 스택 전체 자립성: 가속기(하드웨어)부터 강화학습 프레임워크까지 자체 인프라로 개발.
이는 Microsoft가 단순한 AI 서비스 판매자를 넘어, 모델 개발 역량 자체를 내재화하겠다는 선언입니다.
안전성 — 도움말함과 동일 보상 구조에서 훈련
Microsoft는 'Humanist Superintelligence' 철학 아래 안전성과 도움말함을 별개의 목표로 두지 않았습니다. 두 목표를 동일한 보상 구조(Reward Structure) 안에서 동시에 훈련해 불필요한 거부(Refusal)를 줄였다고 밝혔습니다.
모델은 사람을 대체하는 것이 아니라, '사람과 조직을 돕는 고급 AI 능력'을 지향한다는 점을 강조했습니다.
이용 가능성
- Microsoft Foundry: 비공개 미리보기(Private Preview) 제공 중
- MAI Playground: 공개 미리보기 예정
- 엔터프라이즈 기능: Microsoft Foundry를 통한 보안·규정 준수 환경에서 사용 가능
정리 — GPT 의존 탈피를 선언한 Microsoft
MAI-Thinking-1은 단순한 신모델 발표를 넘어, Microsoft가 OpenAI와의 파트너십에만 의존하지 않겠다는 전략적 신호로 읽힙니다. 자체 추론 모델로 AIME 97%·SWE-Bench Pro 최상위권을 달성한 것은, 향후 Azure AI Foundry 플랫폼에서 독자적인 모델 라인업을 구축하려는 포석입니다.
엔터프라이즈 시장에서 데이터 주권·보안 규정 준수가 중요해지는 흐름 속에서, Microsoft의 자체 모델 전략은 앞으로 더 빠르게 전개될 것으로 보입니다.
💬 댓글 0
댓글을 불러오는 중…