阿里巴巴開源Qwen-Image-Edit AI模型，革新文字驅動的圖像編輯

12:36, 20 八月

编辑者： Veronika Radoslavskaya

阿里巴巴的Qwen團隊於2025年8月18日全球發布了Qwen-Image-Edit，這是一款基於其200億參數Qwen-Image基礎模型打造的開源AI模型。此模型能夠透過文字指令執行複雜的圖像操作，為創意工作者帶來了新的可能性。

Qwen-Image-Edit的核心技術在於其創新的雙編碼架構，結合了Qwen2.5-VL視覺語言模型與變分自編碼器（VAE），以精準平衡語義連貫性與視覺保真度。使用者可透過文字提示進行風格變更或局部修改。該模型在處理圖像中的文字方面表現卓越，中文單字渲染準確率高達97.29%，大幅領先其他模型，這對於需要精確文字呈現的設計和內容創作領域是一大突破。

此模型的開源性質，使其可透過Hugging Face和Qwen Chat等平台廣泛獲取，同時也提供阿里巴巴雲API選項，降低了先進創意工具的使用門檻。此舉不僅是阿里巴巴構建AI生態系統策略的一部分，也反映了AI技術在創意產業的快速演進，使得專業級圖像編輯能力更加普及。

業界分析指出，Qwen-Image-Edit的出現為Adobe等市場領導者帶來了競爭壓力。Adobe透過其Firefly技術強化Photoshop的AI功能，如「生成式填滿」和「生成式擴展」。然而，Qwen-Image-Edit的開源模式為開發者社群提供了參與和創新的平台。Qwen團隊研究員林俊陽表示，此類精密的圖像修改能力，能讓創作者輕鬆完成過去難以想像的細節調整。

總體而言，Qwen-Image-Edit的推出不僅是技術上的里程碑，更是對創意工作流程的深刻啟示，賦予創作者前所未有的自由度和效率，將想像力轉化為現實，並為AI創意領域注入新活力。

來源

WinBuzzer
Qwen-Image-Edit · Hugging Face
Qwen-Image-Edit - Alibaba Cloud Model Studio
Qwen-Image Technical Report

閱讀更多有關此主題的新聞：

30 九月

OpenAI 推出 Sora 2：iOS 平台先進 AI 影音生成應用程式現已開放

30 九月

Opera Neon 瀏覽器：開啟智慧網頁導航新紀元

08 九月

阿里巴巴推出萬億參數AI模型Qwen3-Max-Preview，挑戰全球AI領導者

发现错误或不准确的地方吗？

我们会尽快处理您的评论。

通知中心

通知中心

阿里巴巴開源Qwen-Image-Edit AI模型，革新文字驅動的圖像編輯

來源

閱讀更多有關此主題的新聞：