Alibaba Cloud dan Moonshot AI Luncurkan Model Penalaran Generasi Terbaru

Diedit oleh: Veronika Radoslavskaya

Pada penghujung Januari 2026, industri teknologi kecerdasan buatan global menyaksikan sebuah pencapaian monumental dengan peluncuran dua model unggulan berkinerja tinggi dari Tiongkok secara hampir bersamaan. Alibaba Cloud memperkenalkan Qwen3-Max-Thinking, sementara Moonshot AI merilis Kimi K2.5, di mana kedua model ini merepresentasikan pergeseran paradigma menuju arsitektur yang mengutamakan kemampuan penalaran (reasoning-first). Inovasi ini dirancang khusus untuk menangani logika yang sangat kompleks serta eksekusi tugas secara mandiri tanpa memerlukan banyak campur tangan manusia.

Dirilis secara resmi pada tanggal 26 Januari 2026, Qwen3-Max-Thinking hadir sebagai model penalaran skala besar yang mengusung arsitektur dengan parameter melebihi angka satu triliun. Model canggih ini dikembangkan secara teknis untuk menguasai sintesis logis dalam beberapa tahapan serta memecahkan berbagai persoalan teknis tingkat lanjut yang menuntut tingkat ketelitian dan pemahaman mendalam bagi para penggunanya.

  • Penggunaan Alat Adaptif: Fitur utama yang diunggulkan adalah Penggunaan Alat Adaptif (Adaptive Tool Use), yang memberikan kemampuan otonom kepada model untuk memilih fungsi terbaik antara Pencarian, Memori, atau Interpretasi Kode selama interaksi berlangsung. Sistem AI ini secara cerdas mampu menentukan sendiri alat eksternal mana yang paling relevan untuk memverifikasi data faktual atau melakukan kalkulasi matematis yang rumit berdasarkan konteks permintaan pengguna.
  • Test-Time Scaling (TTS): Selain itu, Qwen3-Max-Thinking mengimplementasikan teknologi Test-Time Scaling (TTS), sebuah metode penskalaan komputasi pada saat inferensi yang memungkinkannya mengalokasikan sumber daya pemrosesan lebih besar guna memikirkan solusi dari masalah yang sangat menantang. Berkat penerapan teknik ini, model tersebut berhasil mencatatkan skor impresif sebesar 90,2 pada tolok ukur Arena-Hard v2 yang sangat kompetitif di industri.
  • Performa Tolok Ukur: Dalam berbagai pengujian performa, Qwen3-Max-Thinking menunjukkan efisiensi yang sangat tinggi di berbagai tolok ukur penalaran global. Kemampuannya sangat menonjol dalam domain komputasi ilmiah, logika matematika yang presisi, serta penyelesaian tugas pengkodean yang berlapis, menjadikannya salah satu model paling andal untuk kebutuhan teknis saat ini.

Hanya berselang satu hari kemudian, tepat pada 27 Januari 2026, Moonshot AI yang mendapatkan dukungan strategis dari Alibaba Group memperkenalkan Kimi K2.5. Model ini hadir sebagai agen multimodal asli yang bersifat sumber terbuka (open-source), yang secara khusus dioptimalkan untuk koordinasi tingkat tinggi serta pemrosesan data dalam skala yang sangat luas guna mendukung berbagai kebutuhan industri secara global.

  • Arsitektur Mixture-of-Experts (MoE): Kimi K2.5 mengusung arsitektur Mixture-of-Experts (MoE) yang sangat efisien dalam penggunaan sumber daya. Meskipun kapasitas total model ini mencapai satu triliun parameter, desain MoE memastikan bahwa hanya sekitar 32 miliar parameter saja yang aktif selama proses pengoperasian. Keunggulan ini didukung oleh proses pra-pelatihan menggunakan dataset raksasa yang mencakup 15 triliun token campuran antara elemen visual dan teks.
  • Mode Agent Swarm: Salah satu inovasi paling menonjol dari Kimi K2.5 adalah Agent Swarm Mode atau Mode Kawanan Agen. Fitur ini memperkenalkan kemampuan Klaster Agen yang memungkinkan koordinasi hingga 100 sub-agen spesialis untuk menyelesaikan satu proyek besar secara terpadu. Dalam mode Swarm ini, sistem memiliki kemampuan untuk mengarahkan dirinya sendiri dalam menyelesaikan masalah rumit tanpa memerlukan instruksi alur kerja yang kaku.
  • Efisiensi Agen: Dari sisi efisiensi operasional, model ini dirancang khusus untuk otomatisasi tingkat perusahaan (enterprise), dengan raihan skor tinggi pada tolok ukur agen seperti HLE dan BrowseComp. Fokus utamanya terletak pada perencanaan multi-langkah dan riset mandiri berbasis peramban web, yang sangat krusial dalam meningkatkan produktivitas dan efisiensi operasional bisnis modern.

Sebagai kesimpulan, meskipun Qwen3-Max-Thinking dan Kimi K2.5 sama-sama dibangun di atas fondasi triliunan parameter, keduanya menawarkan fokus yang sedikit berbeda bagi para penggunanya. Alibaba Cloud melalui Qwen3 lebih memprioritaskan kedalaman penalaran iteratif dan kemandirian dalam pemilihan alat teknis, sementara Moonshot AI melalui Kimi K2.5 lebih menitikberatkan pada koordinasi agen multimodal dan otomatisasi alur kerja otonom dalam skala besar.

11 Tampilan

Sumber-sumber

  • europa press

  • Qwen Team

  • Moonshot AI Open Platform - Kimi Large Language Model API Service

  • Atlas Cloud

  • Vertu

  • Seeking Alpha - Power to Investors

Apakah Anda menemukan kesalahan atau ketidakakuratan?Kami akan mempertimbangkan komentar Anda sesegera mungkin.