Alibaba Lança Qwen-Image-Edit: Revolucionando a Edição de Imagem com IA de Código Aberto

Editado por: Veronika Radoslavskaya

A Alibaba, através da sua equipa Qwen, lançou o Qwen-Image-Edit, um modelo de IA de código aberto que promete redefinir a edição de imagens. Este modelo, construído sobre o modelo base Qwen-Image de 20 mil milhões de parâmetros, oferece capacidades avançadas de manipulação de imagens através de comandos de texto, posicionando-se como um concorrente direto de softwares profissionais como o Adobe Photoshop.

A arquitetura do Qwen-Image-Edit combina um modelo de visão-linguagem (Qwen2.5-VL) com um codificador Variational Autoencoder (VAE), permitindo um equilíbrio entre a compreensão semântica e a reconstrução detalhada da imagem. O modelo destaca-se pela sua capacidade de realizar edições semânticas, como alterações de estilo e síntese de novas vistas, e edições de aparência, que incluem modificações precisas e localizadas.

Uma das características mais notáveis é a melhoria significativa na renderização e edição de texto em imagens, tanto em inglês quanto em chinês. O Qwen-Image-Edit consegue adicionar, remover ou modificar texto preservando a fonte, o tamanho e o estilo originais, um feito historicamente desafiador para modelos de IA. Em cenários com texto em chinês, o modelo demonstra uma precisão de até 97,29% na renderização de caracteres.

A estratégia da Alibaba de lançar modelos de IA de código aberto visa construir um ecossistema de desenvolvimento de IA completo. Ao disponibilizar estas ferramentas poderosas sob a licença Apache 2.0, a empresa procura fomentar uma comunidade global de desenvolvedores que possam inovar sobre a sua tecnologia. A disponibilidade em plataformas como Hugging Face e Qwen Chat, juntamente com uma opção de API paga na Alibaba Cloud, democratiza o acesso a estas capacidades avançadas.

O lançamento do Qwen-Image-Edit insere-se numa tendência mais ampla de democratização das ferramentas criativas impulsionada pela IA. A sua natureza de código aberto e a capacidade de oferecer funcionalidades comparáveis às de softwares profissionais estabelecidos, sem custos de licenciamento diretos para uso comercial, representam um movimento disruptivo no mercado. Este desenvolvimento sinaliza uma mudança significativa na forma como as ferramentas criativas avançadas podem ser desenvolvidas e distribuídas no futuro, promovendo a colaboração aberta e a iteração rápida.

A relevância desta notícia é acentuada pelo rápido avanço do panorama da IA, especialmente no setor de ferramentas criativas. A libertação de um modelo de edição de imagem tão poderoso desafia diretamente gigantes da indústria como a Adobe, abrindo novas possibilidades para profissionais criativos e democratizando o acesso a capacidades avançadas. A Alibaba tem demonstrado um compromisso contínuo com a IA, tendo lançado recentemente outros modelos de ponta, como o Qwen3-Thinking para raciocínio e o Wan2.2 para geração de vídeo, reforçando a sua estratégia de construir uma pilha de desenvolvimento de IA abrangente.

Fontes

  • WinBuzzer

  • Qwen-Image-Edit · Hugging Face

  • Qwen-Image-Edit - Alibaba Cloud Model Studio

  • Qwen-Image Technical Report

Encontrou um erro ou imprecisão?

Vamos considerar seus comentários assim que possível.

Alibaba Lança Qwen-Image-Edit: Revoluciona... | Gaya One