Alibaba a lancé Qwen-Image-Edit, un nouveau modèle d'intelligence artificielle open source, le 18 août 2025. Cet outil promet de transformer l'édition d'images grâce à des manipulations complexes réalisables par de simples instructions textuelles, se positionnant ainsi comme un concurrent direct de logiciels professionnels tels qu'Adobe Photoshop.
Développé par l'équipe Qwen d'Alibaba, Qwen-Image-Edit s'appuie sur le modèle de fondation Qwen-Image de 20 milliards de paramètres. Son architecture novatrice utilise un double encodage combinant un modèle vision-langage (Qwen2.5-VL) pour la compréhension sémantique et un auto-encodeur variationnel (VAE) pour la reconstruction détaillée des images. Cette approche permet deux modes d'édition: l'édition sémantique pour des changements stylistiques globaux et l'édition d'apparence pour des modifications précises et localisées.
Une caractéristique notable de Qwen-Image-Edit est sa capacité améliorée à rendre et modifier du texte en anglais et en chinois au sein des images, un défi technique souvent complexe pour les IA. La stratégie d'Alibaba, en rendant disponibles des modèles open source performants, vise à bâtir un écosystème de développement IA et à fédérer une communauté mondiale de développeurs, favorisant ainsi une innovation plus rapide que les plateformes propriétaires.
Le paysage de l'édition d'images par IA est de plus en plus concurrentiel, avec des acteurs comme ByteDance (SeedEdit) et Black Forest Labs (Flux.1 Kontext) proposant également des solutions innovantes. Ces avancées soulignent la rapidité des progrès en matière d'édition d'images ciblée et de rendu de texte par IA. Auparavant, modifier des parties spécifiques d'une image sans affecter le reste était une tâche ardue pour l'IA, mais des modèles comme Qwen-Image-Edit repoussent ces limites.
Adobe continue d'intégrer des fonctionnalités IA dans Photoshop, comme les outils basés sur Firefly. Cependant, la nature open source et les capacités multilingues de Qwen-Image-Edit le positionnent comme un concurrent de taille, potentiellement capable de remodeler les dynamiques du marché des outils créatifs. La disponibilité de Qwen-Image-Edit sur des plateformes telles que Hugging Face et Qwen Chat, ainsi qu'une option API payante via Alibaba Cloud, élargit son accessibilité.