Google Ra Mắt Gemini 3 Flash: Trí Tuệ Tiên Phong Tối Ưu Hóa Cho Tốc Độ
Chỉnh sửa bởi: Veronika Radoslavskaya
Vào ngày 17 tháng 12 năm 2025, Google đã chính thức bổ sung vào dòng sản phẩm Gemini 3 với sự ra mắt của Gemini 3 Flash. Mô hình mới này được thiết kế đặc biệt để mang lại khả năng suy luận ở cấp độ “Pro” nhưng vẫn giữ được độ trễ thấp và hiệu suất cao vốn có của dòng Flash. Điều này giúp trí tuệ nhân tạo cấp cao trở nên dễ tiếp cận hơn cho các ứng dụng đòi hỏi phản hồi gần như tức thời.
Gemini 3 Flash ra đời nhằm mục đích thu hẹp khoảng cách giữa hiệu suất xử lý sâu và tốc độ phản hồi nhanh nhạy. Theo thông báo từ Google, mô hình này nhanh hơn gấp ba lần so với phiên bản tiền nhiệm là Gemini 2.5 Pro, đồng thời còn thể hiện chất lượng vượt trội trên nhiều tiêu chí quan trọng khác.
Kết Hợp Sức Mạnh Suy Luận và Tốc Độ Vượt Trội
Sức mạnh của Gemini 3 Flash được minh chứng qua các bài kiểm tra học thuật và kỹ thuật chuyên sâu. Mô hình đã đạt được kết quả ấn tượng, cho thấy khả năng cạnh tranh sòng phẳng với các mô hình tiên tiến lớn hơn:
- Khả năng Suy luận Cấp độ Tiến sĩ: Trên chuẩn GPQA Diamond, mô hình đạt 90.4%, và trên bài kiểm tra “Bài thi Cuối cùng của Nhân loại” (không sử dụng công cụ hỗ trợ), nó đạt 33.7%. Những con số này khẳng định kiến thức sâu rộng về khoa học và học thuật của nó.
- Hiệu suất Đa phương tiện Xuất sắc: Về khả năng xử lý dữ liệu phức tạp về hình ảnh và không gian, Gemini 3 Flash đạt 81.2% trên chuẩn MMMU Pro, ngang bằng với hiệu suất của Gemini 3 Pro vốn mạnh mẽ hơn.
- Lập trình Nâng cao: Trong bài kiểm tra mã hóa SWE-bench Verified, Gemini 3 Flash ghi điểm 78%, vượt qua cả Gemini 3 Pro và các phiên bản 2.5 trước đó. Điều này định vị nó là công cụ lý tưởng cho các tác nhân AI tự động hóa việc viết mã.
Các Tính năng Chính Dành Cho Nhà Phát Triển và Người Dùng
Hiện tại, mô hình này đã trở thành công cụ mặc định trong toàn bộ hệ sinh thái người tiêu dùng của Google, thay thế Gemini 2.5 Flash để mang lại trải nghiệm “thế hệ tiếp theo” mà không phát sinh thêm chi phí.
- Tư duy Thích ứng: Trong ứng dụng Gemini, mô hình cung cấp hai chế độ hoạt động rõ rệt: chế độ “Nhanh” để nhận câu trả lời tức thì và chế độ “Suy nghĩ” dành cho các vấn đề phức tạp, nơi mô hình có thể điều chỉnh độ sâu của quá trình suy luận.
- Quy trình Tác nhân (Agentic Workflows): Độ trễ thấp cùng độ chính xác cao khiến nó hoàn hảo để xây dựng các tác nhân AI phản hồi nhanh, ví dụ như trợ lý trong trò chơi thời gian thực, hỗ trợ khách hàng trực tuyến, hoặc các công cụ kiểm thử A/B tự động cho lập trình viên.
- Lý luận Hình ảnh và Không gian: Người dùng có thể tận dụng mô hình để phân tích video hoặc hình ảnh ngay lập tức—chẳng hạn như nhận hướng dẫn từng bước về một cú đánh golf hoặc nhận hỗ trợ trực tiếp khi đang phác thảo.
- Tích hợp Tìm kiếm: Gemini 3 Flash đang được triển khai làm mô hình mặc định cho Chế độ AI trong Tìm kiếm. Điều này giúp các truy vấn phức tạp được trả lời một cách chi tiết, có cấu trúc và dễ hình dung hơn.
Về mặt kỹ thuật, Gemini 3 Flash hiện đã sẵn sàng thông qua API Gemini trên Google AI Studio, Vertex AI và nền tảng phát triển tác nhân mới của Google, Antigravity. Mô hình này hỗ trợ cửa sổ ngữ cảnh lớn lên tới 1 triệu token và có khả năng xử lý đồng thời văn bản, hình ảnh, âm thanh, video và tài liệu PDF một cách nguyên bản.
14 Lượt xem
Nguồn
Xataka
9to5Google
Google Developers Blog
Google
OpenAI
Engadget
Search Engine Journal
ZDNET
Reddit
SiliconANGLE
Mashable
Google DeepMind
Google
Google
DataCamp
Databricks
Đọc thêm tin tức về chủ đề này:
Bạn có phát hiện lỗi hoặc sai sót không?
Chúng tôi sẽ xem xét ý kiến của bạn càng sớm càng tốt.
