AI피디아

알리바바 Qwen 3 공식 출시: 차세대 오픈소스 LLM의 진화 본문

AI

알리바바 Qwen 3 공식 출시: 차세대 오픈소스 LLM의 진화

에이마이마스터 2025. 4. 29. 14:38

Qwen 3

 

2025년 4월 29일, 알리바바(Alibaba)는 새로운 대규모 언어 모델 시리즈인 Qwen 3를 정식 발표했습니다. 이번 Qwen 3는 단순 업그레이드가 아니라, 하이브리드 사고 모드, 향상된 에이전트 능력, 강화된 멀티링구얼 지원, 그리고 초대규모 MoE 모델을 포함하는, 완전히 새로운 세대의 LLM입니다.

이번 글에서는 알리바바 공식 블로그 내용을 기반으로 Qwen 3의 최신 정보, 주요 특징, 모델 스펙, 성능 향상 포인트를 자세히 분석합니다.


Qwen 3 모델 라인업

Qwen 3는 Dense 모델MoE 모델로 나뉘어 다양한 크기와 용도에 맞게 설계되었습니다.

오픈웨이트 모델 리스트

모델 이름 파라미터 수 (총/활성) 컨텍스트 길이 특징
Qwen3-0.6B 6억 32K tokens 소형, 경량화
Qwen3-1.7B 17억 32K tokens 경량 서버용
Qwen3-4B 40억 32K tokens 균형형
Qwen3-8B 80억 128K tokens 중형, 빠른 응답
Qwen3-14B 140억 128K tokens 대형 서버 환경용
Qwen3-32B 320억 128K tokens 대형 모델
Qwen3-30B-A3B (MoE) 총 300억 / 활성 30억 128K tokens 하이브리드 모드 최적화
Qwen3-235B-A22B (MoE) 총 2,350억 / 활성 220억 128K tokens 초거대 모델, 최상위 성능

Qwen3-235B-A22B와 Qwen3-30B-A3B는 MoE(Mixture of Experts) 구조를 사용하여, 계산 효율성과 성능을 모두 잡은 혁신적 모델입니다.


주요 특징

1. 하이브리드 사고 모드 (Hybrid Thinking Modes)

Qwen 3는 두 가지 사고 모드를 지원합니다.

  • Thinking Mode: 복잡한 문제에 대해 단계별 추론을 진행하여 더 깊고 정확한 답변을 생성합니다.
  • Non-Thinking Mode: 간단한 질문에 대해 빠르고 직관적인 답변을 제공합니다.

사용자는 작업의 난이도나 요구 사항에 따라, '생각을 많이 할지, 빠르게 답할지'를 자유롭게 설정할 수 있어 추론 품질비용 효율성을 동시에 조정할 수 있습니다.

2. 멀티링구얼 지원 (Multilingual Capability)

Qwen 3는 119개 언어와 방언을 지원합니다.

이를 통해 글로벌 서비스 구축에 매우 강력한 기반을 제공합니다.

3. 강화된 에이전트 능력 (Improved Agentic Capabilities)

Qwen 3는 특히 코딩, 수학, 추론, 에이전트 기반 작업에서 강력한 성능을 발휘하도록 최적화되었습니다.

4. 데이터셋 및 사전학습 개선 (Pre-training Update)

  • 36조 토큰 규모 데이터로 학습 (Qwen2.5 대비 2배)
  • 수학, 코딩, STEM 데이터 비중 대폭 강화
  • 긴 문서 학습을 위한 고품질 장문 데이터 추가
  • 3단계 학습: 4K → 32K 토큰 컨텍스트 확장

성능 비교

Qwen 3 모델들은 같은 크기의 기존 모델 대비 성능이 비약적으로 향상되었습니다.

테스트 항목 Qwen3-235B-A22B 주요 비교 모델 비고
MMLU Top-tier 수준 DeepSeek-R1, Gemini 2.5-Pro 등과 경쟁 지식 이해
GSM8K 매우 우수 o1, Grok-3 대비 우세 수학 문제 해결
HumanEval 상위권 성적 OpenCoder 2, GPT-4 대비 근접 코딩 문제 해결

 

특히, Qwen3-4B 모델조차 Qwen2.5-72B-Instruct 수준의 성능을 보이는 등, 모델 최적화와 학습 효율성 면에서 큰 발전이 있었습니다.


개발 및 배포 지원

Qwen 3 모델은 다음과 같은 플랫폼에서 바로 다운로드 및 사용이 가능합니다.

  • Hugging Face
  • ModelScope
  • Kaggle

또한 다음과 같은 환경에서 로컬 배포 및 실험이 가능합니다:

  • vLLM, SGLang (서버 배포용)
  • Ollama, LMStudio, MLX, llama.cpp, KTransformers (로컬 실행)

라이선스는 Apache 2.0으로, 상업적 사용, 파인튜닝, 재배포가 자유롭습니다.


요약 및 전망

Qwen 3는 다음과 같은 AI 트렌드를 이끌 핵심 특징을 갖추고 있습니다.

  • 초거대 MoE 모델 → 효율성과 품질 모두 확보
  • 하이브리드 사고 모드 → 유연한 추론 제어
  • 초다언어 지원 → 글로벌 서비스 대응
  • 완전 오픈소스 정책 → 개발 및 연구자 친화적

앞으로 Qwen 3는 LLM 기반 챗봇, 에이전트 서비스, 코딩 지원 도구 등 다양한 분야에서 널리 활용될 가능성이 높습니다. 또한, 조만간 발표될 Qwen-VL (Vision-Language 멀티모달 버전) 과 연계해 더욱 확장된 기능을 제공할 예정입니다.