Google vừa giới thiệu "Chế độ AI" (AI Mode), một tính năng đột phá trong công cụ tìm kiếm, cho phép người dùng tìm kiếm bằng hình ảnh và nhận phản hồi chi tiết, có ngữ cảnh. Tính năng này được hỗ trợ bởi phiên bản tùy chỉnh của mô hình Gemini 2.5 và tận dụng khả năng hiểu hình ảnh của Google Lens, cho phép diễn giải toàn bộ khung cảnh trong ảnh, nhận diện đối tượng, vật liệu, màu sắc và cách sắp xếp chúng trong không gian. Người dùng có thể tải ảnh hoặc dùng camera điện thoại để đặt câu hỏi về những gì họ nhìn thấy trong thời gian thực, ví dụ như tải lên ảnh một cuốn sách và yêu cầu đề xuất các tựa sách tương tự, kèm theo liên kết mua hàng.
Chế độ AI cũng hỗ trợ tìm kiếm trực quan theo thời gian thực, cho phép người dùng hướng camera vào các đối tượng để nhận câu trả lời và gợi ý ngay lập tức. Công nghệ phiên bản tùy chỉnh của Gemini 2.5 cung cấp khả năng suy luận và "tư duy" tiên tiến, nâng cao độ chính xác và hiệu suất. Google sử dụng kỹ thuật "visual search fan-out" để tạo ra nhiều truy vấn liên quan trong nền, nhằm hiểu sâu hơn về hình ảnh và ý định của người dùng, cho phép phân tích sắc thái của các chi tiết tinh tế và đối tượng phụ. Ban đầu, tính năng này có sẵn bằng tiếng Anh cho người dùng tại Hoa Kỳ và đang được triển khai theo từng giai đoạn, với kế hoạch mở rộng quốc tế sớm.
Google đã dần mở rộng quyền truy cập, đưa tính năng này từ giai đoạn thử nghiệm trong Search Labs đến phạm vi sẵn có rộng rãi hơn cho người dùng tại Hoa Kỳ. Công ty cũng liên tục nâng cấp Chế độ AI với các công cụ mới, bao gồm các tính năng mua sắm. Chế độ AI cũng tích hợp với Shopping Graph của Google, chứa hơn 50 tỷ danh sách sản phẩm, cho phép trải nghiệm mua sắm đàm thoại. Chế độ AI còn được tích hợp với các dịch vụ Google khác, như Gmail, để có các đề xuất cá nhân hóa hơn. Sự phát triển này thể hiện cam kết của Google trong việc tích hợp AI và khả năng đa phương thức vào trải nghiệm tìm kiếm cốt lõi, nhằm cung cấp một công cụ trực quan, mạnh mẽ và phong phú hơn cho người dùng khi điều hướng cảnh quan kỹ thuật số. Khả năng tìm kiếm và khám phá bằng hình ảnh, kết hợp với việc tinh chỉnh hội thoại, đánh dấu một sự thay đổi đáng kể theo hướng tương tác tự nhiên và dựa trên ngữ cảnh hơn với các công cụ tìm kiếm.