Alibaba ha lanciato Qwen-Image-Edit, un nuovo modello AI open-source basato sul suo modello fondazionale Qwen-Image da 20 miliardi di parametri. Questo strumento avanzato per la manipolazione di immagini tramite comandi testuali si propone come un concorrente diretto di software professionali come Adobe Photoshop.
Qwen-Image-Edit si distingue per la sua architettura a doppia codifica, che integra un modello vision-language (Qwen2.5-VL) per la comprensione semantica e un Variational Autoencoder (VAE) per la ricostruzione dettagliata. Questa combinazione permette al modello di operare in due modalità di editing: Semantic Editing, per modifiche stilistiche ampie e trasformazioni come il trasferimento di stile o la sintesi di nuove viste, e Appearance Editing, per interventi precisi e localizzati, come l'aggiunta o la rimozione di elementi specifici senza alterare il resto dell'immagine.
Una delle caratteristiche più notevoli di Qwen-Image-Edit è la sua eccellente capacità nel rendering e nella modifica di testo all'interno delle immagini, supportando fluentemente sia l'inglese che il cinese. Questo modello è stato rilasciato globalmente il 18 agosto 2025 ed è accessibile tramite piattaforme come Hugging Face e Qwen Chat, con Alibaba Cloud che offre anche un'opzione API a pagamento.
Questa iniziativa di Alibaba, che segue il rilascio di altri modelli AI open-source, mira a costruire uno stack di sviluppo AI completo, incoraggiando una comunità globale di sviluppatori a innovare sulla sua tecnologia. L'introduzione di Qwen-Image-Edit rappresenta un passo significativo nell'evoluzione degli strumenti creativi guidati dall'AI, democratizzando l'accesso a capacità di editing sofisticate e stimolando un ecosistema di innovazione collaborativa.