This is an info Alert.
⌘K
  • Home
  • News
  • Blog
  • Releases
  • LLM history
  • Compare LLMs
  • Library
  • About
Sign in
DeepSeek

26 декабря 2024

DeepSeek-V3

Context: 65.5KInput: $0.27 / 1MOutput: $1.1 / 1M

What's new
  • MoE-модель на 671B параметров (37B активны на токен), обучена на ~14.8 трлн токенов
  • Уровень GPT-4o и Claude 3.5 Sonnet при радикально меньшей цене
  • Открытые веса (MIT), обучение обошлось всего в ~$5.5 млн (2.788 млн H800-часов)
  • Контекст API 64K токенов, максимум вывода 8K
  • Стартовый промо-прайс действовал до 8 февраля 2025, затем стандартный тариф $0.27/$1.10
Verdict

V3 сделала фронтир-уровень почти бесплатным и запустила ценовую войну на рынке LLM.

DeepSeek

A blog and notes on development. The easiest way to reach me is via the social links below.

Documents
Terms of UsePrivacy Policy
Contacts
talalaev.misha@gmail.com

© All rights reserved.