Китайская компания Meituan заявляет о новой модели искусственного интеллекта, обученной на отечественных чипах

Китайский гигант по доставке еды Meituan объявил о выпуске и намерении открыть исходный код своей модели обработки больших языков LongCat следующего поколения, утверждая, что это первая в мире система искусственного интеллекта с триллионом параметров, обученная и работающая полностью на кластере из 50 000 чипов, работающих на процессорах китайского производства.
Meituan, которую часто сравнивают с DoorDash, является поздним участником переполненного и хорошо финансируемого китайского сектора ИИ, где конкурентами являются DeepSeek и Doubao от ByteDance. Команда LongCat, основанная в 2023 году, запустила свою первую модель только в конце прошлого года.
Хотя компания не раскрыла, как новая модель LongCat-2.0 будет интегрирована в ее существующие бизнес-процессы, Meituan использовала более ранние версии для работы внутри приложений с помощью ИИ-помощников, которые рекомендуют рестораны и отели и выполняют такие задачи, как заказ еды и бронирование номеров, что является частью тренда «агентской коммерции», который в этом году ускорил ее конкурент Alibaba.
На фоне слабых потребительских настроений и снижения рентабельности Meituan, возможно, также стремится диверсифицировать источники дохода. В заявлении на официальном аккаунте LongCat в WeChat компания подчеркнула способность модели создавать игровой веб-сайт и писать романы.
ФОКУС НА САМООБЕСПЕЧЕННОСТИ
Зависимость LongCat-2.0 от китайских чипов для ИИ подчеркивает растущую важность самообеспечения на внутреннем рынке ИИ Китая, поскольку DeepSeek, Alibaba, ByteDance и другие крупные игроки стремятся снизить зависимость от американских чипов для обучения своих моделей после введения экспортного контроля Вашингтоном с 2022 года.
Производители чипов, включая Huawei и Enflame, быстро заполнили пробел, оставленный американскими производителями чипов, завоевав долю рынка за счет соглашений о поставках с разработчиками ИИ.
Согласно заявлению, LongCat-2.0 был обучен с нуля с использованием 50 000 отечественных чипов и может обрабатывать входные данные объемом до 1 миллиона токенов, что позволяет ему обрабатывать сверхдлинные документы.
Модель ориентирована на агентное программирование, а её архитектура разработана для более эффективного и надёжного решения реальных задач программирования.
Предварительная версия модели уже стала одной из трёх наиболее часто используемых моделей на OpenRouter, популярной во всём мире торговой площадке ИИ, сообщила компания.
По утверждению Meituan, LongCat-2.0 сравнялась или превзошла несколько ведущих проприетарных моделей, включая Gemini от Google, GPT-5.5 от OpenAI и Claude Opus от Anthropic, по некоторым показателям программирования и производительности агентов.
«LongCat-2.0 продемонстрировала, что теперь у нас есть возможность обучать крупномасштабные модели на отечественных вычислительных кластерах», — заявила китайская технологическая компания, не называя производителя чипов.
Источник: Reuters
