Qwen-Image-Edit: Revolusi Penyuntingan Gambar Berbasis Teks dari Alibaba

Diedit oleh: Veronika Radoslavskaya

Alibaba, melalui tim Qwen-nya, telah meluncurkan Qwen-Image-Edit, sebuah model AI open-source yang dirancang untuk melakukan manipulasi gambar tingkat lanjut melalui perintah teks. Model ini dibangun di atas fondasi model Qwen-Image yang memiliki 20 miliar parameter dan menggunakan arsitektur dual-encoding yang inovatif.

Qwen-Image-Edit membedakan dirinya dengan kemampuannya untuk melakukan penyuntingan semantik, yang mencakup perubahan gaya dan sintesis tampilan baru, serta penyuntingan penampilan yang memungkinkan modifikasi objek yang presisi. Salah satu fitur utamanya adalah kemampuannya yang ditingkatkan untuk merender dan memodifikasi teks dalam gambar, baik dalam bahasa Inggris maupun Mandarin, sebuah tugas yang secara historis menantang bagi AI. Arsitektur dual-encodingnya menggabungkan model bahasa-visual (Qwen2.5-VL) untuk pemahaman semantik dan Variational Autoencoder (VAE) untuk rekonstruksi detail, yang secara efektif menyeimbangkan kebebasan kreatif dengan kesetiaan visual.

Peluncuran global Qwen-Image-Edit pada 18 Agustus 2025 menandai langkah signifikan dalam lanskap alat kreatif yang didukung AI. Model ini secara langsung menantang dominasi perangkat lunak profesional yang sudah mapan seperti Adobe Photoshop, yang digunakan oleh lebih dari 90% profesional kreatif di seluruh dunia. Dengan menawarkan kemampuan canggih ini secara gratis di bawah lisensi Apache 2.0 yang ramah komersial, Alibaba mendemokratisasi akses ke alat pengeditan AI yang kuat, yang berpotensi mempercepat inovasi dan mengubah alur kerja kreatif.

Strategi Alibaba untuk merilis model AI open-source, termasuk Qwen-Image-Edit, adalah bagian dari upaya yang lebih luas untuk membangun tumpukan pengembangan AI yang komprehensif. Pendekatan ini bertujuan untuk membina komunitas pengembang global yang dapat membangun di atas teknologinya, yang berpotensi mendorong inovasi lebih cepat daripada platform tertutup dan berpemilik. Langkah ini sejalan dengan tren yang lebih luas di industri AI Tiongkok, di mana perusahaan merangkul strategi open-source untuk bersaing secara domestik dan internasional. Kemunculan Qwen-Image-Edit menyoroti pergeseran yang berkembang dalam distribusi alat kreatif canggih, yang menekankan kolaborasi terbuka dan iterasi cepat. Kemampuannya, terutama dalam rendering dan pengeditan teks bilingual, memposisikannya sebagai pesaing yang tangguh di pasar yang terus berkembang ini. Ini menandakan era baru di mana alat AI yang kuat menjadi lebih mudah diakses, memberdayakan individu dan bisnis untuk mewujudkan visi kreatif mereka dengan presisi dan efisiensi yang belum pernah terjadi sebelumnya.

Sumber-sumber

  • WinBuzzer

  • Qwen-Image-Edit · Hugging Face

  • Qwen-Image-Edit - Alibaba Cloud Model Studio

  • Qwen-Image Technical Report

Apakah Anda menemukan kesalahan atau ketidakakuratan?

Kami akan mempertimbangkan komentar Anda sesegera mungkin.

Qwen-Image-Edit: Revolusi Penyuntingan Gam... | Gaya One