Meta
5 апреля 2025
Llama 4 Maverick 17B-128E
Контекст: 1MВход: — / 1MВыход: — / 1M
Что нового
- MoE-архитектура: 17B активных параметров из ~400B всего, 128 экспертов
- Нативно мультимодальная (текст + изображения), early fusion; открытые веса
- Контекст до 1M токенов; со-дистилляция из Llama 4 Behemoth
- По заявлению Meta обходит GPT-4o и Gemini 2.0 Flash в своём классе
- Лицензия Llama 4 Community License; веса на Hugging Face. (Младшая Llama 4 Scout — до 10M контекста.)
Вердикт
Флагман открытой линейки Llama 4 — мультимодальная MoE-модель уровня топовых закрытых конкурентов при всего 17B активных параметров.