Google Ra Mắt Gemini 2.5 Flash Image: Bước Tiến Mới Trong Sáng Tạo Hình Ảnh

Chỉnh sửa bởi: gaya ❤️ one

Vào ngày 2 tháng 10 năm 2025, Google đã chính thức công bố Gemini 2.5 Flash Image, một mô hình trí tuệ nhân tạo tiên tiến dành cho việc tạo và chỉnh sửa hình ảnh. Sản phẩm này hiện đã có sẵn thông qua Gemini API, Google AI Studio và Vertex AI, đánh dấu một bước tiến quan trọng trong việc dân chủ hóa khả năng sáng tạo hình ảnh bằng AI.

Gemini 2.5 Flash Image mang đến những cải tiến đáng kể, bao gồm hỗ trợ 10 tỷ lệ khung hình khác nhau, từ phong cảnh điện ảnh đến định dạng dọc cho mạng xã hội. Một nâng cấp cốt lõi là khả năng duy trì tính nhất quán của nhân vật, giữ nguyên đặc điểm ngoại hình qua các chỉnh sửa lớn, giải quyết một thách thức phổ biến mà nhiều mô hình AI tạo sinh hình ảnh gặp phải. Khả năng xử lý đa phương thức (multimodal) gốc cho phép mô hình tiếp nhận và xử lý đồng thời cả văn bản và hình ảnh, đảm bảo các chỉnh sửa chính xác và nhất quán hơn.

Với mức giá cạnh tranh là 0,039 USD cho mỗi hình ảnh và 30 USD cho mỗi triệu token đầu ra, Google đặt mục tiêu thúc đẩy việc áp dụng rộng rãi trong các doanh nghiệp thông qua Vertex AI. Những người dùng tiên phong đã bày tỏ sự hài lòng về các khả năng độc đáo của mô hình. Công ty khởi nghiệp AI Cartwheel, thông qua lời chia sẻ của đồng sáng lập Andrew Carr, đã ghi nhận khả năng xử lý các tư thế phức tạp từ mọi góc độ camera của Gemini 2.5 Flash Image, đồng thời cung cấp cả sự trung thực về tư thế và "kiến thức thế giới".

Sự ra mắt này là một phản ứng chiến lược của Google trong một thị trường ngày càng cạnh tranh, đặc biệt khi OpenAI đã tích hợp trình tạo ảnh GPT-4o vào ChatGPT. Google mong muốn đạt được sự chấp nhận rộng rãi bằng cách đưa Gemini đến gần hơn với người dùng thông qua các ứng dụng trò chuyện cốt lõi của mình. Để giải quyết vấn đề deepfake và tăng cường sự minh bạch, Google đang triển khai cả hình mờ SynthID có thể nhìn thấy và không nhìn thấy trên tất cả nội dung do AI tạo ra, được phát triển bởi Google DeepMind, giúp xác định rõ nguồn gốc.

Bằng cách tích hợp các công cụ chỉnh sửa thân thiện với người dùng vào sản phẩm AI hàng đầu, Google định vị Gemini như một cỗ máy sáng tạo toàn diện. Động thái này thể hiện sự đầu tư vào khả năng tiếp cận và xây dựng lòng tin để thu hút người dùng phổ thông trong lĩnh vực AI tạo sinh đang phát triển nhanh chóng.

Nguồn

  • WinBuzzer

  • Gemini Flash - Google DeepMind

  • Introducing Gemini 2.5 Flash Image, our state-of-the-art image model

  • Building next-gen visuals with Gemini 2.5 Flash Image (aka nano-banana) on Vertex AI

  • Google I/O 2025: Updates to Gemini 2.5 from Google DeepMind

  • Release notes | Gemini API | Google AI for Developers

Bạn có phát hiện lỗi hoặc sai sót không?

Chúng tôi sẽ xem xét ý kiến của bạn càng sớm càng tốt.