This is an info Alert.
⌘K
  • Главная
  • Новости
  • Блог
  • Релизы
  • История LLM
  • Сравнение LLM
  • Библиотека
  • Обо мне
Вход

Блог и заметки о разработке. Для связи удобнее всего использовать соцсети ниже.

Документы
Условия использованияПолитика конфиденциальности
Контакты
talalaev.misha@gmail.com

© Все права защищены.

Meituan обучила модель на 1.6 трлн параметров без GPU от Nvidia

Mikhail T. (Sh0ny)
Mikhail T. (Sh0ny)
5 июля 2026
  1. Главная
  2. Блог
  3. Meituan обучила модель на 1.6 трлн параметров без GPU от Nvidia
1 мин чтения

Коротко

Китайская компания Meituan выпустила фундаментальную модель LongCat-2.0, полностью обученную и развернутую на отечественных AI ASIC суперкомпьютерах. Модель архитектуры Mixture-of-Experts демонстрирует высокие результаты, но главная сенсация — отсутствие видеокарт Nvidia в цикле обучения.

Китайская технологическая компания Meituan представила LongCat-2.0 — фундаментальную языковую модель с 1,6 триллиона параметров. Главная особенность релиза заключается не в характеристиках самой нейросети, а в инфраструктуре: обучение и развертывание модели прошли на отечественных суперкомпьютерах с AI ASIC, без использования GPU от Nvidia.

Архитектура и производительность

Модель построена на архитектуре Mixture-of-Experts (MoE) с общим числом параметров 1,6 трлн и активацией около 48 млрд параметров на один токен. До официального анонса LongCat-2.0 тестировалась на платформе OpenRouter под псевдонимом Owl Alpha, где вошла в тройку лидеров по объему использования. В сценариях агентов Claude Code модель заняла второе место в мире, уступив только Claude Opus 4.8.

По оценкам технического сообщества, агентные способности LongCat-2.0 находятся на уровне Claude Opus 4.6. В задачах программирования модель немного превосходит GLM-5.1, но уступает GLM-5.2.

Обучение на отечественных чипах

Ключевое значение имеет тот факт, что весь цикл от обучения до инференса был построен на вычислительном кластере внутри страны. По данным Meituan, предобучение проводилось на более чем 35 триллионах токенов без критических сбоев и откатов.

Ранее подобные достижения Китая в сфере отечественных чипов касались лишь узких задач, таких как инференс или дообучение готовых моделей. В случае с LongCat-2.0 речь идет о полном цикле создания модели масштаба триллиона параметров с нуля.

Детали аппаратного обеспечения

Meituan официально не раскрывает точные модели чипов и их количество. В материалах компании упоминаются лишь «отечественные ИИ-чипы» и «суперподы AI ASIC».

Однако китайские СМИ и сообщество предполагают, что для обучения использовалось около 50 000 ускорителей. По косвенным признакам, таким как поддержка 200Gbps RDMA и 64 ГБ HBM на кристалл, специалисты делают вывод о применении оборудования класса Huawei Ascend 910C. Официального подтверждения от Meituan или Huawei на этот счет пока не было.

Источник: Hacker News - Newest: ""AI" "LLM""

новостиaiтехнологииразработка
Понравился разбор? Получайте такие раз в неделю на почту
​

Комментарии

(0)
​