Qwen-Image-Edit: Mô hình AI Mã nguồn Mở của Alibaba Thay đổi Cuộc chơi Chỉnh sửa Ảnh

Chỉnh sửa bởi: Veronika Radoslavskaya

Vào ngày 18 tháng 8 năm 2025, Alibaba đã chính thức ra mắt Qwen-Image-Edit, một mô hình trí tuệ nhân tạo mã nguồn mở tiên tiến, cho phép người dùng thực hiện các thao tác chỉnh sửa ảnh phức tạp chỉ bằng các câu lệnh văn bản.

Công cụ này, được phát triển bởi đội ngũ Qwen của Alibaba, xây dựng dựa trên mô hình nền tảng Qwen-Image với 20 tỷ tham số và sử dụng kiến trúc mã hóa kép độc đáo. Kiến trúc này kết hợp mô hình ngôn ngữ thị giác Qwen2.5-VL để hiểu ngữ nghĩa và Bộ mã hóa Tự động Biến đổi (VAE) để tái tạo chi tiết, mang đến sự cân bằng giữa khả năng sáng tạo và độ trung thực của hình ảnh. Qwen-Image-Edit cung cấp hai chế độ chỉnh sửa: Chỉnh sửa Ngữ nghĩa để thay đổi phong cách tổng thể và Chỉnh sửa Ngoại hình để điều chỉnh cục bộ, chính xác.

Một điểm nổi bật quan trọng là khả năng hiển thị và sửa đổi văn bản nâng cao bằng cả tiếng Anh và tiếng Trung, với tỷ lệ chính xác ký tự đơn lên tới 97,29% đối với tiếng Trung, vượt trội so với các mô hình hàng đầu khác. Sự đổi mới này cho phép Qwen-Image-Edit thực hiện các chỉnh sửa văn bản song ngữ, đồng thời giữ nguyên phông chữ, kích thước và kiểu dáng ban đầu. Sự ra mắt này đặt Qwen-Image-Edit vào vị thế cạnh tranh trực tiếp với các phần mềm chuyên nghiệp như Adobe Photoshop, vốn được hơn 90% các chuyên gia sáng tạo trên toàn thế giới sử dụng.

Qwen-Image-Edit có sẵn trên các nền tảng như Hugging Face và Qwen Chat, với tùy chọn API trả phí trên Alibaba Cloud. Sự ra mắt này là một phần trong chiến lược rộng lớn hơn của Alibaba nhằm xây dựng một bộ công cụ phát triển AI toàn diện, nhằm mục đích nuôi dưỡng một cộng đồng nhà phát triển toàn cầu có thể xây dựng dựa trên công nghệ của mình. Trong bối cảnh ngành công nghiệp sáng tạo đang phát triển nhanh chóng, việc cung cấp các công cụ AI mạnh mẽ, mã nguồn mở như Qwen-Image-Edit có khả năng dân chủ hóa khả năng sáng tạo nâng cao và định hình lại các động lực thị trường trong tương lai. Các đối thủ cạnh tranh như ByteDance và Black Forest Labs cũng đã giới thiệu các khả năng chỉnh sửa ảnh của riêng họ, trong khi Adobe tiếp tục cải tiến Photoshop với các tính năng mới như 'Harmonize' và 'Generative Upscale' được cung cấp bởi Firefly.

Junyang Lin, một nhà nghiên cứu tại Đội ngũ Qwen, đã nhấn mạnh khả năng của mô hình trong việc thực hiện các sửa đổi tinh vi, chẳng hạn như loại bỏ một sợi tóc. Sự phát triển này phản ánh xu hướng ngày càng tăng trong lĩnh vực AI, nơi các công cụ mã nguồn mở đang ngày càng thách thức các giải pháp độc quyền, thúc đẩy sự đổi mới và khả năng tiếp cận cho một lượng lớn người dùng trên toàn cầu. Các nhà phân tích cho rằng Qwen-Image-Edit đại diện cho một bước tiến quan trọng, mang đến các công cụ mạnh mẽ và dễ tiếp cận, có khả năng thay đổi cách các chuyên gia sáng tạo và những người đam mê tiếp cận việc chỉnh sửa ảnh.

Nguồn

  • WinBuzzer

  • Qwen-Image-Edit · Hugging Face

  • Qwen-Image-Edit - Alibaba Cloud Model Studio

  • Qwen-Image Technical Report

Bạn có phát hiện lỗi hoặc sai sót không?

Chúng tôi sẽ xem xét ý kiến của bạn càng sớm càng tốt.

Qwen-Image-Edit: Mô hình AI Mã nguồn Mở củ... | Gaya One