Китайский технологический гигант Meituan 31 августа 2025 года официально представил и сделал общедоступной свою передовую модель искусственного интеллекта LongCat-Flash-Chat. Эта модель с открытым исходным кодом, построенная на архитектуре Mixture-of-Experts (MoE), обладает впечатляющими 560 миллиардами параметров, при этом активируя от 18,6 до 31,3 миллиарда параметров на контекст. Такая выборочная активация оптимизирует вычислительную эффективность и производительность, особенно в задачах, связанных с агентами.
Инновационная архитектура MoE Meituan включает механизм «экспертов с нулевыми вычислениями» и дизайн «MoE с короткими соединениями», что повышает эффективность обучения и инференса за счет оптимизации перекрытия коммуникаций. Это позволило модели достичь скорости инференса, превышающей 100 токенов в секунду. Выпуск LongCat-Flash-Chat подчеркивает приверженность Meituan разработке ИИ, следуя за запуском инструмента для кодирования ИИ NoCode в июне 2025 года.
Открытое распространение LongCat-Flash-Chat на платформах, таких как GitHub и Hugging Face, демократизирует доступ к передовым технологиям ИИ, способствуя инновациям в глобальной экосистеме ИИ. Исследования показывают, что организации, использующие ИИ с открытым исходным кодом, получают экономию затрат и ускоряют циклы инноваций. Meituan, предоставляя этот ценный инструмент, соответствует тенденции, позволяя небольшим компаниям более эффективно конкурировать.
Производительность модели была протестирована в сравнении с ведущими моделями ИИ, демонстрируя конкурентоспособные результаты в следовании инструкциям, использовании агентских инструментов и математическом мышлении. Эти достижения отражают глубокое понимание Meituan в разработке больших моделей и оптимизации инфраструктуры.