Google
14 мая 2024
Gemini 1.5 Pro 128k→1M context (GA май 2024)
Контекст: 1MВход: $7 / 1MВыход: $21 / 1M
Что нового
- Первый массовый прорыв в длинном контексте: до 1M токенов (в исследованиях тестировали до 10M) — тогда рекорд среди foundation-моделей
- Новая архитектура Mixture-of-Experts на базе Transformer: выше качество при меньших вычислениях
- Нативная мультимодальность: до 1 часа видео, 11 часов аудио, кодовые базы 30k+ строк в одном запросе
- Цена на старте многоуровневая: базовый тариф до 128k токенов ($7/$21), выше 128k — вдвое дороже
- В июне 2024 контекст расширили до 2M токенов; в октябре 2024 цену снизили (до ~$2.5/$10)
Вердикт
Модель, которая в одиночку сделала «миллион токенов контекста» новым стандартом индустрии и задала темп всей линейке Gemini.