Qwen-Image-Edit от Alibaba: ИИ-инструмент для редактирования изображений с открытым исходным кодом

Отредактировано: Veronika Radoslavskaya

Компания Alibaba, через свою команду Qwen, представила Qwen-Image-Edit — модель искусственного интеллекта с открытым исходным кодом, призванную изменить сферу редактирования изображений. Этот инструмент, основанный на 20-миллиардной модели Qwen-Image, позволяет пользователям выполнять сложные манипуляции с изображениями с помощью текстовых подсказок, напрямую конкурируя с профессиональным программным обеспечением, таким как Adobe Photoshop. Глобальный выпуск Qwen-Image-Edit состоялся 18 августа 2025 года, предлагая пользователям по всему миру передовые возможности редактирования.

Модель построена на архитектуре Multimodal Diffusion Transformer (MMDiT) и использует двойную кодирующую архитектуру, которая сочетает в себе модель видения и языка (Qwen2.5-VL) для семантического понимания и вариационный автоэнкодер (VAE) для детальной реконструкции. Этот подход обеспечивает баланс между семантической согласованностью и визуальной точностью, позволяя выполнять как широкие стилистические изменения (семантическое редактирование), так и точные локализованные модификации (редактирование внешнего вида).

Одной из ключевых особенностей Qwen-Image-Edit является его улучшенная способность рендеринга и редактирования текста на английском и китайском языках. Это решает давнюю проблему в области ИИ, где точное управление текстом в изображениях было сложной задачей. Модель может добавлять, удалять или изменять текст, сохраняя при этом оригинальный шрифт, размер и стиль. Эта функция особенно ценна для таких задач, как брендинг, реклама и создание контента, где типографическая точность имеет решающее значение.

Стратегия Alibaba по выпуску мощных моделей с открытым исходным кодом, таких как Qwen-Image-Edit, направлена на создание комплексного стека для разработки ИИ и развитие глобального сообщества разработчиков. Этот подход, как подчеркнул председатель Alibaba Джо Цай, способствует более широкому распространению инноваций, выходя за рамки возможностей крупных технологических гигантов. Открытый исходный код демократизирует доступ к передовым технологиям, позволяя предприятиям любого размера внедрять инновации и создавать уникальные решения.

В то время как Adobe Photoshop остается отраслевым стандартом, которым пользуются более 90% творческих профессионалов, появление таких инструментов, как Qwen-Image-Edit, сигнализирует о сдвиге в ландшафте. Открытый характер и мощные возможности модели предлагают доступную альтернативу дорогостоящим проприетарным системам. Исследования показывают, что рынок редактирования изображений с помощью ИИ растет, и такие инструменты, как Qwen-Image-Edit, вероятно, будут играть значительную роль в его будущем развитии.

Qwen-Image-Edit доступен на таких платформах, как Hugging Face и Qwen Chat, а также через платный API Alibaba Cloud. Его выпуск является частью более широкой стратегии Alibaba по созданию полного стека разработки ИИ, включая предыдущие модели, такие как Qwen3-Thinking для рассуждений и Wan2.2 для генерации видео. Этот шаг подчеркивает стремление Alibaba к открытому сотрудничеству и быстрому совершенствованию в конкурентной среде ИИ.

Источники

  • WinBuzzer

  • Qwen-Image-Edit · Hugging Face

  • Qwen-Image-Edit - Alibaba Cloud Model Studio

  • Qwen-Image Technical Report

Вы нашли ошибку или неточность?

Мы учтем ваши комментарии как можно скорее.

Qwen-Image-Edit от Alibaba: ИИ-инструмент ... | Gaya One