Meta
5 апреля 2025
Llama 4 Maverick 17B-128E
Context: 1MInput: — / 1MOutput: — / 1M
What's new
- MoE-архитектура: 17B активных параметров из ~400B всего, 128 экспертов
- Нативно мультимодальная (текст + изображения), early fusion; открытые веса
- Контекст до 1M токенов; со-дистилляция из Llama 4 Behemoth
- По заявлению Meta обходит GPT-4o и Gemini 2.0 Flash в своём классе
- Лицензия Llama 4 Community License; веса на Hugging Face. (Младшая Llama 4 Scout — до 10M контекста.)
Verdict
Флагман открытой линейки Llama 4 — мультимодальная MoE-модель уровня топовых закрытых конкурентов при всего 17B активных параметров.