アリババクラウドとMoonshot AIが次世代推論モデルを発表：AI技術の新たな地平

18:28, 27 1月

編集者： Veronika Radoslavskaya

🚀 Introducing Qwen3-Max-Thinking, our most capable reasoning model yet. Trained with massive scale and advanced RL, it delivers strong performance across reasoning, knowledge, tool use, and agent capabilities. ✨ Key innovations: ✅ Adaptive tool-use: intelligently leverages

3:13 PM · Jan 26, 2026

4.2K

Read 200 replies

Watch on X

2026年1月下旬、人工知能（AI）の分野において、中国から2つの高性能なフラッグシップモデルが同時に登場し、大きな注目を集めました。アリババクラウドが発表した「Qwen3-Max-Thinking」と、Moonshot AIによる「Kimi K2.5」です。これらのリリースは、複雑な論理思考や自律的なタスク実行を重視する「推論優先」のアーキテクチャへの重要な転換を象徴しています。

Kimi.ai

@Kimi_Moonshot

·Follow

🥝 Meet Kimi K2.5, Open-Source Visual Agentic Intelligence. 🔹 Global SOTA on Agentic Benchmarks: HLE full set (50.2%), BrowseComp (74.9%) 🔹 Open-source SOTA on Vision and Coding: MMMU Pro (78.5%), VideoMMMU (86.6%), SWE-bench Verified (76.8%) 🔹 Code with Taste: turn chats,

5:42 AM · Jan 27, 2026

15.9K

Read 776 replies

Watch on X

2026年1月26日に公開されたアリババクラウドの「Qwen3-Max-Thinking」は、1兆パラメータを超える圧倒的な規模を誇る大規模推論モデルです。このモデルは、多段階の論理合成や高度な技術的問題の解決を処理するために設計されており、次世代のAI基盤としての役割を担っています。

アダプティブ・ツール・ユース：このモデルの核心的な機能であり、対話の中で検索、メモリ、あるいはコードインタープリターといった外部機能をAIが自律的に選択することを可能にします。ユーザーの問いかけに対し、事実確認や計算が必要な場合、どのツールをいつ使うべきかをAI自身が判断します。
推論時計算スケーリング（TTS）：難解な課題に直面した際、モデルがより多くの計算リソースを「思考」プロセスに割り当てる技術を採用しています。この手法により、Arena-Hard v2ベンチマークにおいて90.2という驚異的なスコアを記録しました。
ベンチマーク性能：Qwen3-Max-Thinkingは、科学計算、数学的論理、そして複雑なコーディングタスクといった複数の推論ベンチマークにおいて極めて高い効率性を実証しており、専門的な知見が求められる現場での活用が期待されています。

翌日の2026年1月27日、アリババグループの支援を受けるMoonshot AIは「Kimi K2.5」を発表しました。これはオープンソースで提供されるネイティブ・マルチモーダル・エージェントモデルであり、大規模なデータ処理と高度な連携能力に最適化されています。

混合専門家（MoE）アーキテクチャ：総パラメータ数は1兆に達しますが、MoE設計により、稼働時にアクティブになるのは320億パラメータに抑えられています。学習には、視覚情報とテキスト情報を組み合わせた15兆トークンという膨大なデータセットが使用されました。
エージェント・スウォーム（群れ）モード：最大100個の専門化されたサブエージェントを一つのプロジェクト内で連携させる革新的な機能を導入しました。スウォームモードでは、人間が詳細なワークフローを定義しなくても、システムが自律的にエージェントを指揮して複雑な問題を解決します。
エージェント効率：企業レベルの自動化を念頭に置いて設計されており、HLEやBrowseCompといったベンチマークで高い評価を得ています。多段階の計画立案やブラウザベースの調査能力に優れ、実務における高い実用性を備えています。

両モデルとも1兆パラメータ級の基盤を持ちながら、その焦点は微妙に異なります。アリババのQwen3-Max-Thinkingが深い反復推論と自律的なツール選択を優先しているのに対し、Moonshot AIのKimi K2.5はマルチモーダルなエージェント連携と大規模な自律ワークフローの構築に重きを置いています。

これらの技術革新は、AIが単なるチャットボットの枠を超え、複雑なビジネスプロセスや科学的探究を自律的に支えるパートナーへと進化していることを裏付けています。2026年は、推論能力の飛躍的向上が産業界に大きなインパクトを与える年になるでしょう。