Claude Opus 4.5 dari Anthropic: Lompatan Baru dalam Pengkodean Agentik dan Efisiensi
Diedit oleh: Veronika Radoslavskaya
Anthropic baru saja memperkenalkan Claude Opus 4.5, sebuah terobosan yang memposisikannya sebagai model paling mumpuni dari perusahaan tersebut hingga saat ini. Peluncuran ini tidak hanya menetapkan standar baru dalam industri untuk agen otonom dan penggunaan komputer yang kompleks, tetapi juga berfokus pada keseimbangan antara kapabilitas maksimal dengan peningkatan efisiensi token yang signifikan. Hasilnya, kinerja unggulan kini menjadi lebih andal dan ekonomis untuk beban kerja produksi di dunia nyata.
Fitur utama yang membedakan Opus 4.5 adalah stabilitas dan ketahanannya yang superior dalam menangani tugas otonom berjangka panjang. Model-model sebelumnya sering kali goyah ketika dihadapkan pada penalaran multi-langkah yang berkelanjutan. Sebaliknya, Opus 4.5 menunjukkan peningkatan performa yang jauh lebih baik dalam alur kerja kompleks yang berkelanjutan, mulai dari refactoring kode skala besar hingga pemecahan masalah bug pada sistem yang saling terhubung. Peningkatan ini mencerminkan kedalaman stabilitas dan nuansa penalaran yang lebih baik.
Salah satu contoh nyata kemajuan ini terlihat dalam simulasi layanan pelanggan maskapai penerbangan. Dalam skenario yang rumit, Opus 4.5 berhasil menyajikan solusi yang tidak standar namun sah untuk permintaan pelanggan yang kompleks. Sistem pengujian formal awalnya gagal mengenali solusi tersebut dan sempat menandainya sebagai kesalahan. Kemampuan untuk menavigasi ambiguitas secara kreatif dan memecahkan masalah di luar jalur yang sudah diprediksi ini menandakan kemajuan besar dalam penerapan praktis di lapangan.
Bagi para pengembang, Opus 4.5 menetapkan tolok ukur baru yang sangat dominan. Model ini mencetak rekor state-of-the-art pada tes rekayasa perangkat lunak dunia nyata, seperti SWE-bench Verified, menunjukkan kinerja yang melampaui model-model pendahulunya dalam memperbaiki cacat perangkat lunak. Keunggulan teknis ini diimbangi dengan efisiensi token yang luar biasa. Dokumentasi Anthropic mengungkapkan bahwa untuk tugas-tugas dengan kompleksitas tinggi tertentu, Opus 4.5 memerlukan hingga 76% lebih sedikit token keluaran dibandingkan model lama dari keluarga Opus dan Sonnet untuk mencapai hasil yang setara. Efisiensi ini sangat krusial bagi mereka yang membangun alur kerja agentik—program AI yang dirancang untuk beroperasi secara mandiri—karena secara fundamental menekan latensi dan biaya operasional.
Untuk memberikan kendali penuh kepada pengguna dalam menyeimbangkan kecepatan dan kedalaman analisis, Anthropic memperkenalkan Effort Parameter. Parameter ini memungkinkan pengembang untuk menentukan apakah mereka memerlukan upaya “rendah” (respons tercepat dan paling efisien token untuk otomatisasi volume tinggi) atau upaya “tinggi” (ketelitian maksimal dan kedalaman penalaran untuk analisis yang sangat kompleks). Kontrol yang dapat disesuaikan atas proses internal model ini memungkinkan bisnis menyesuaikan kinerja AI secara tepat sesuai kebutuhan dan anggaran tugas yang dihadapi.
Lebih lanjut, model ini mempertahankan jendela konteks yang lapang sebesar 200.000 token, yang sangat memadai untuk penelitian dokumen mendalam. Selain itu, Opus 4.5 dilengkapi dengan manajemen konteks yang lebih halus. Ia secara otomatis meringkas dan memprioritaskan riwayat percakapan sebelumnya. Hal ini menghasilkan kinerja yang sangat konsisten selama sesi pengguna yang panjang dan melalui integrasi penting seperti Claude untuk Excel dan berbagai mitra IDE (Integrated Development Environment).
Sumber-sumber
@businessline
Mint
Medium
Anthropic
Wikipedia
CNET
Baca lebih banyak berita tentang topik ini:
Apakah Anda menemukan kesalahan atau ketidakakuratan?
Kami akan mempertimbangkan komentar Anda sesegera mungkin.
