DeepSeek Merilis Model V3.2, Menetapkan Tolok Ukur Efisiensi Baru untuk AI Terdepan
Diedit oleh: Veronika Radoslavskaya
Perusahaan kecerdasan buatan yang berbasis di Hangzhou, DeepSeek, secara resmi mengumumkan peluncuran dua model AI eksperimental terbarunya pada tanggal 1 Desember 2025. Model-model tersebut adalah DeepSeek-V3.2 dan varian khususnya, DeepSeek-V3.2-Speciale. Langkah ini menempatkan pengembang open-source ini dalam persaingan langsung dengan model unggulan milik perusahaan tertutup. DeepSeek mengklaim bahwa pengenalan ini menetapkan standar baru dalam hal efisiensi sekaligus mencapai kesetaraan kompetitif di beberapa domain spesifik.
Menurut DeepSeek, terdapat kemajuan arsitektural signifikan pada platform mereka, terutama dalam integrasi kemampuan penalaran tingkat lanjut yang dipadukan dengan eksekusi tugas otonom. Hal ini membuktikan bahwa sistem sumber terbuka masih mampu bersaing ketat melawan model tertutup terkemuka yang berasal dari Silicon Valley. Inovasi ini menegaskan bahwa lanskap AI kini semakin kompetitif, tidak hanya didominasi oleh pemain besar dengan sumber daya tertutup.
Terobosan teknologi utama yang menjadi motor penggerak efisiensi model baru ini adalah mekanisme DeepSeek Sparse Attention (DSA). Inovasi arsitektural ini secara substansial mengurangi kompleksitas komputasi yang biasanya melekat pada pemrosesan konteks yang sangat panjang. Dampaknya, model mampu mempertahankan kecepatan inferensi yang tinggi sambil menekan biaya komputasi secara signifikan. Ini adalah kabar baik bagi para pengembang yang membutuhkan performa tinggi tanpa menguras sumber daya.
Iterasi utama, DeepSeek-V3.2, memanfaatkan arsitektur DSA ini dan merupakan pengembangan dari kapabilitas penggunaan alat (tool-use) yang sudah diperkenalkan pada versi V3.1. Versi terbaru ini mendukung pemanfaatan alat eksternal, seperti kalkulator, mesin pencari, dan eksekutor kode. Fleksibilitas ini ditawarkan melalui dua mode operasional: 'thought' dan 'no-thought'. Model ini menunjukkan performa yang sangat kuat pada tantangan pengkodean dunia nyata, termasuk pada tolok ukur SWE-bench Verified, dan mendapat apresiasi tinggi dari komunitas dalam lingkungan kompetitif, memposisikannya di jajaran teratas untuk beban kerja umum yang seimbang.
Sementara itu, varian khusus, DeepSeek-V3.2-Speciale, dirancang secara khusus untuk mencapai performa puncak dalam perhitungan matematika yang rumit dan tantangan penalaran multi-langkah yang panjang. DeepSeek menyatakan bahwa versi Speciale ini mampu menyamai metrik performa milik Gemini-3 Pro milik Google dalam evaluasi penalaran tertentu. Ini menunjukkan lompatan besar dalam kemampuan penalaran murni yang dimiliki model open-source ini.
Lebih lanjut, perusahaan melaporkan bahwa DeepSeek-V3.2-Speciale berhasil meraih performa tingkat emas pada kumpulan data tolok ukur yang mensimulasikan iterasi tahun 2025 dari kompetisi global bergengsi. Kompetisi tersebut termasuk Olimpiade Matematika Internasional (IMO) dan Olimpiade Informatika Internasional (IOI). Akses ke model DeepSeek-V3.2-Speciale yang membutuhkan komputasi tinggi saat ini masih dibatasi melalui titik akhir API sementara hingga tanggal 15 Desember 2025, menandakan fase peluncuran yang terkontrol. Sebaliknya, model standar V3.2 sudah dapat diakses segera melalui aplikasi dan antarmuka web. Perkembangan pesat dalam pengembangan AI ini mengindikasikan bahwa kerangka kerja open-source sedang bergerak cepat untuk menjadi kompetitif secara fungsional dengan sistem proprietary di berbagai domain yang kompleks.
Sumber-sumber
Gestión
DeepSeek - Wikipedia
DeepSeek-V3.2 Release
2025 Major Release: How Does DeepSeekMath-V2 Achieve Self-Verifying Mathematical Reasoning? Complete Technical Analysis - DEV Community
DeepSeek launches two new AI models to take on Gemini and ChatGPT | Mint
DeepSeek releases AI model 'DeepSeek-Math-V2' specialized for mathematical reasoning, achieving a gold medal-level accuracy rate at the International Mathematical Olympiad - GIGAZINE
Baca lebih banyak berita tentang topik ini:
Apakah Anda menemukan kesalahan atau ketidakakuratan?
Kami akan mempertimbangkan komentar Anda sesegera mungkin.
