阿里巴巴開源Qwen-Image-Edit AI模型,革新文字驅動的圖像編輯

编辑者: Veronika Radoslavskaya

阿里巴巴的Qwen團隊於2025年8月18日全球發布了Qwen-Image-Edit,這是一款基於其200億參數Qwen-Image基礎模型打造的開源AI模型。此模型能夠透過文字指令執行複雜的圖像操作,為創意工作者帶來了新的可能性。

Qwen-Image-Edit的核心技術在於其創新的雙編碼架構,結合了Qwen2.5-VL視覺語言模型與變分自編碼器(VAE),以精準平衡語義連貫性與視覺保真度。使用者可透過文字提示進行風格變更或局部修改。該模型在處理圖像中的文字方面表現卓越,中文單字渲染準確率高達97.29%,大幅領先其他模型,這對於需要精確文字呈現的設計和內容創作領域是一大突破。

此模型的開源性質,使其可透過Hugging Face和Qwen Chat等平台廣泛獲取,同時也提供阿里巴巴雲API選項,降低了先進創意工具的使用門檻。此舉不僅是阿里巴巴構建AI生態系統策略的一部分,也反映了AI技術在創意產業的快速演進,使得專業級圖像編輯能力更加普及。

業界分析指出,Qwen-Image-Edit的出現為Adobe等市場領導者帶來了競爭壓力。Adobe透過其Firefly技術強化Photoshop的AI功能,如「生成式填滿」和「生成式擴展」。然而,Qwen-Image-Edit的開源模式為開發者社群提供了參與和創新的平台。Qwen團隊研究員林俊陽表示,此類精密的圖像修改能力,能讓創作者輕鬆完成過去難以想像的細節調整。

總體而言,Qwen-Image-Edit的推出不僅是技術上的里程碑,更是對創意工作流程的深刻啟示,賦予創作者前所未有的自由度和效率,將想像力轉化為現實,並為AI創意領域注入新活力。

來源

  • WinBuzzer

  • Qwen-Image-Edit · Hugging Face

  • Qwen-Image-Edit - Alibaba Cloud Model Studio

  • Qwen-Image Technical Report

发现错误或不准确的地方吗?

我们会尽快处理您的评论。

阿里巴巴開源Qwen-Image-Edit AI模型,革新文字驅動的圖像編輯 | Gaya One