DeepSeek
26 декабря 2024
DeepSeek-V3
Контекст: 65.5KВход: $0.27 / 1MВыход: $1.1 / 1M
Что нового
- MoE-модель на 671B параметров (37B активны на токен), обучена на ~14.8 трлн токенов
- Уровень GPT-4o и Claude 3.5 Sonnet при радикально меньшей цене
- Открытые веса (MIT), обучение обошлось всего в ~$5.5 млн (2.788 млн H800-часов)
- Контекст API 64K токенов, максимум вывода 8K
- Стартовый промо-прайс действовал до 8 февраля 2025, затем стандартный тариф $0.27/$1.10
Вердикт
V3 сделала фронтир-уровень почти бесплатным и запустила ценовую войну на рынке LLM.