Qwen-Image-Edit від Alibaba: Нова ера в редагуванні зображень за допомогою ШІ

Відредаговано: Veronika Radoslavskaya

Команда Qwen від Alibaba представила Qwen-Image-Edit, революційну модель штучного інтелекту з відкритим кодом, яка переосмислює можливості редагування зображень за допомогою текстових підказок. Цей інструмент, випущений 18 серпня 2025 року, позиціонується як потужний конкурент професійним програмним забезпеченням, таким як Adobe Photoshop, що використовується понад 90% світових креативних професіоналів.

Qwen-Image-Edit побудований на основі моделі Qwen-Image з 20 мільярдами параметрів і використовує інноваційну архітектуру подвійного кодування. Ця архітектура поєднує модель зорової мови (Qwen2.5-VL) для семантичного розуміння та варіаційний автокодувальник (VAE) для детальної реконструкції. Такий підхід дозволяє моделі ефективно обробляти як семантичні, так і візуальні аспекти редагування. Модель пропонує два режими редагування: Семантичне редагування для широких стилістичних змін та Редагування зовнішнього вигляду для точних, локалізованих модифікацій.

Особливо відзначається здатність моделі точно відтворювати та редагувати текст англійською та китайською мовами, що є значним досягненням у сфері ШІ. Це дозволяє користувачам виконувати складні редагування за допомогою простих текстових команд, таких як зміна одягу, модифікація фонів або точне редагування тексту на зображеннях, зберігаючи при цьому оригінальний шрифт, розмір та стиль.

Випуск Qwen-Image-Edit є частиною ширшої стратегії Alibaba щодо створення комплексного стеку розробки ШІ та вирощування глобальної спільноти розробників. Модель доступна на платформах, таких як Hugging Face та Qwen Chat, а також через платний API Alibaba Cloud. Її відкритий характер та розширені можливості роблять її потужним конкурентом на ринку ШІ-редагування зображень, демократизуючи доступ до передових творчих інструментів та впливаючи на майбутні ринкові динаміки.

Завдяки своїм передовим можливостям, Qwen-Image-Edit демонструє високу продуктивність на різних бенчмарках, перевершуючи конкурентів у завданнях редагування зображень, включаючи семантичні та візуальні модифікації, а також точне редагування тексту. Це робить його цінним інструментом для креативних професіоналів та розробників, що прагнуть до інновацій у сфері ШІ.

Джерела

  • WinBuzzer

  • Qwen-Image-Edit · Hugging Face

  • Qwen-Image-Edit - Alibaba Cloud Model Studio

  • Qwen-Image Technical Report

Знайшли помилку чи неточність?

Ми розглянемо ваші коментарі якомога швидше.

Qwen-Image-Edit від Alibaba: Нова ера в ре... | Gaya One