Le géant chinois des services à la demande, Meituan, a officiellement lancé et rendu open source son nouveau modèle d'intelligence artificielle, LongCat-Flash-Chat. Annoncé le 31 août 2025, ce modèle se distingue par son architecture innovante de type « Mixture of Experts » (MoE) et un total de 560 milliards de paramètres, dont seulement 18,6 à 31,3 milliards sont activés par contexte. Cette approche permet une gestion dynamique des ressources et une efficacité computationnelle accrue.
LongCat-Flash-Chat utilise un mécanisme d'« experts à calcul nul » et une architecture à connexions courtes (ScMoE) pour optimiser les performances et la vitesse d'inférence, atteignant plus de 100 tokens par seconde. Ces caractéristiques le positionnent comme un concurrent sérieux face à des modèles de premier plan tels que Deepseek V3.1, Qwen3, Kimi K2, GPT 4.1, Claude Sonnet et Gemini 2.5 Flash.
Le modèle excelle particulièrement dans les tâches liées aux agents intelligents, se classant premier dans le benchmark VitaBench. Il obtient également des scores élevés dans des évaluations générales comme ArenaHard-V2, MMLU et CEval, démontrant ainsi sa polyvalence et sa puissance.
Cette initiative s'inscrit dans la stratégie d'IA de Meituan, qui a également lancé son agent de codage IA, NoCode, en juin 2025. En rendant LongCat-Flash-Chat accessible via des plateformes comme GitHub et Hugging Face, Meituan contribue à la démocratisation de l'IA, favorisant la collaboration et l'innovation au sein de la communauté mondiale des développeurs.