Google ra mắt Gemini 2.5 Flash Image: Bước nhảy vọt trong sáng tạo và chỉnh sửa ảnh bằng AI

Chỉnh sửa bởi: Veronika Radoslavskaya

Google đã chính thức giới thiệu Gemini 2.5 Flash Image, một mô hình AI tiên tiến được thiết kế để cách mạng hóa khả năng tạo và chỉnh sửa hình ảnh. Mô hình này, được biết đến với tên mã 'Nano Banana', hứa hẹn mang lại cho người dùng quyền kiểm soát chưa từng có đối với các chỉnh sửa ảnh, khắc phục những hạn chế trước đây của các công cụ chỉnh sửa ảnh bằng AI.

Một trong những tính năng nổi bật của Gemini 2.5 Flash Image là khả năng hợp nhất nhiều hình ảnh, cho phép người dùng kết hợp nhiều bức ảnh thành một tác phẩm duy nhất một cách liền mạch. Tính năng này đặc biệt hữu ích cho việc tạo ra các bản dựng sản phẩm phức tạp hoặc các cảnh đa nhân vật. Hơn nữa, mô hình còn đảm bảo tính nhất quán của nhân vật, giúp duy trì hình dáng và đặc điểm của chủ thể qua nhiều lần chỉnh sửa hoặc trong các bối cảnh khác nhau, điều này rất quan trọng cho việc kể chuyện và xây dựng thương hiệu.

Khả năng chỉnh sửa theo ngữ cảnh bằng ngôn ngữ tự nhiên là một điểm mạnh khác, cho phép người dùng thực hiện các điều chỉnh chính xác như làm mờ hậu cảnh, xóa vật thể, thay đổi tư thế hoặc tô màu cho ảnh đen trắng chỉ bằng các câu lệnh đơn giản. Gemini 2.5 Flash Image còn tích hợp kiến thức thế giới thực, cho phép nó hiểu và xử lý các yêu cầu phức tạp hơn, bao gồm cả việc diễn giải các sơ đồ vẽ tay hoặc hỗ trợ các câu hỏi liên quan đến thế giới thực. Điều này mang lại một chiều sâu mới cho khả năng sáng tạo, vượt ra ngoài việc chỉ tạo ra hình ảnh chân thực.

Để đảm bảo tính minh bạch và trách nhiệm, Google đã triển khai các biện pháp an toàn mạnh mẽ. Tất cả hình ảnh được tạo ra hoặc chỉnh sửa bằng Gemini 2.5 Flash Image đều được gắn một hình mờ kỹ thuật số vô hình thông qua công nghệ SynthID, giúp xác định nguồn gốc AI của nội dung. Ngoài ra, còn có một hình mờ có thể nhìn thấy được để tăng cường khả năng nhận diện.

Gemini 2.5 Flash Image hiện có sẵn cho cả người dùng miễn phí và trả phí thông qua ứng dụng Gemini. Các nhà phát triển có thể truy cập mô hình này thông qua Gemini API, Google AI Studio và Vertex AI. Về chi phí, mô hình được định giá ở mức 30 đô la cho mỗi 1 triệu token đầu ra, tương đương khoảng 0,039 đô la cho mỗi hình ảnh. Sự ra mắt này củng cố vị thế của Google trong thị trường chỉnh sửa ảnh bằng AI, cung cấp các công cụ chính xác, thân thiện với người dùng và mạnh mẽ cho cả cá nhân sáng tạo và doanh nghiệp.

Nguồn

  • Republic World

  • Introducing Gemini 2.5 Flash Image, our state-of-the-art image model

  • Google Gemini’s AI image model gets a ‘bananas’ upgrade

  • Google Gemini 2.5 Flash Image brings a new 'bananas' upgrade to AI image generation

  • Nano banana is here: Google unveils Gemini 2.5 Flash Image upgrade

  • Google’s Gemini 2.5 Flash Image does it all – From blurring backgrounds to multi-image fusion

Bạn có phát hiện lỗi hoặc sai sót không?

Chúng tôi sẽ xem xét ý kiến của bạn càng sớm càng tốt.