Alibaba、高度な画像編集を可能にするオープンソースAIモデル「Qwen-Image-Edit」を発表

編集者: Veronika Radoslavskaya

AlibabaのQwenチームは、テキストプロンプトによる高度な画像編集を可能にするオープンソースAIモデル「Qwen-Image-Edit」を発表しました。このモデルは、200億パラメータを持つQwen-Image基盤モデルを基盤としており、2025年8月18日にグローバルリリースされました。Qwen-Image-Editは、視覚的な意味論的理解を担当するQwen2.5-VLと、詳細な再構築を担う変分オートエンコーダー(VAE)を組み合わせたデュアルエンコーディングアーキテクチャを採用しています。これにより、広範なスタイル変更を行うセマンティック編集と、局所的で精密な変更を行うアピアランス編集の両方を効果的に処理できます。

特に、英語と中国語の両方で画像内のテキストをレンダリングおよび編集する能力は、このモデルの際立った特徴であり、テキスト編集の精度を大幅に向上させます。研究者のJunyang Lin氏によると、髪の毛一本のような繊細な画像編集も可能です。

このモデルは、Hugging FaceやQwen Chatなどのプラットフォームで利用可能であり、Alibaba CloudのAPIを通じて有料オプションも提供されています。オープンソースとして提供されることで、クリエイティブなワークフローの民主化を促進し、高度な画像編集機能をより多くの人々が利用できるようになります。AlibabaのQwenチームは、このオープンモデルのリリースを通じて、グローバルな開発者コミュニティを育成し、その技術基盤の上に革新を築くことを目指しています。

Adobeのクリエイティブプロフェッショナル部門のプロダクトマーケティング担当バイスプレジデントであるDeepa Subramaniam氏は、Photoshopの進化について、クリエイティブコミュニティとの対話に基づき、創造的な障壁を取り除くツールの開発を目指していると述べています。Qwen-Image-Editの登場は、Adobeのような既存の業界リーダーにとって、オープンソースAIの急速な進化と、それがクリエイティブソフトウェア市場に与える影響を改めて認識させるものとなるでしょう。

Qwen-Image-Editは、その高度な機能とオープンソースという性質により、クリエイティブ業界におけるAIの役割を再定義する可能性を秘めています。このモデルは、画像編集のプロセスを効率化し、新たな創造的な可能性を解き放つことで、プロフェッショナルからアマチュアまで、あらゆるユーザーに強力なツールを提供します。特に、テキストレンダリングにおけるその精度は、ブランディング、広告、コンテンツ制作など、多岐にわたる分野で新たな基準を打ち立てる可能性があります。

ソース元

  • WinBuzzer

  • Qwen-Image-Edit · Hugging Face

  • Qwen-Image-Edit - Alibaba Cloud Model Studio

  • Qwen-Image Technical Report

エラーや不正確な情報を見つけましたか?

できるだけ早くコメントを考慮します。

Alibaba、高度な画像編集を可能にするオープンソースAIモデル「Qwen-Ima... | Gaya One