OpenAI Ra Mắt GPT-5.4 Mini và Nano Tối Ưu Hóa Tốc Độ và Chi Phí
Chỉnh sửa bởi: Aleksandr Lytviak
Vào ngày 17 tháng 3 năm 2026, OpenAI đã công bố việc triển khai hai phiên bản thu gọn của dòng sản phẩm GPT-5.4, bao gồm GPT-5.4 Mini và GPT-5.4 Nano. Các mô hình này được thiết kế chuyên biệt nhằm xử lý các khối lượng công việc có tần suất cao, các tác vụ lập trình, hệ thống tác nhân phụ (subagents) và các nhiệm vụ đa phương thức theo thời gian thực. Động thái này đánh dấu sự dịch chuyển chiến lược của công ty nhằm cân bằng giữa hiệu suất, độ trễ và khả năng chi trả, phù hợp với xu hướng ngành AI năm 2026 hướng tới các danh mục mô hình chuyên biệt hơn là chỉ tập trung vào các mô hình nguyên khối.
GPT-5.4 Mini được nhắm mục tiêu cụ thể vào các quy trình làm việc của nhà phát triển đòi hỏi tính phản hồi nhanh, chẳng hạn như trợ lý viết mã, diễn giải ảnh chụp màn hình giao diện người dùng và suy luận hình ảnh trực tiếp. Mô hình này chạy nhanh hơn gấp đôi so với phiên bản tiền nhiệm là GPT-5 Mini và đạt được mức hiệu suất tiệm cận với GPT-5.4 trên các bài kiểm tra tiêu chuẩn như SWE-Bench Pro và OSWorld-Verified. Trong nền tảng Codex, GPT-5.4 Mini tiêu thụ chỉ 30% hạn mức của GPT-5.4 cho các quy trình làm việc của tác nhân phụ, cho phép các nhà phát triển xử lý các tác vụ mã hóa đơn giản hơn với chi phí ước tính chỉ bằng một phần ba so với mô hình lớn hơn. Mô hình này hỗ trợ đầu vào văn bản và hình ảnh, gọi hàm, sử dụng công cụ và tìm kiếm web, với cửa sổ ngữ cảnh mở rộng lên tới 400 nghìn token.
Đối với các tác vụ ưu tiên tốc độ và hiệu quả chi phí tối đa, GPT-5.4 Nano được giới thiệu là lựa chọn nhỏ nhất và nhanh nhất trong dòng sản phẩm. OpenAI khuyến nghị mô hình này cho các công việc như phân loại, trích xuất dữ liệu, xếp hạng và các tác vụ hỗ trợ đơn giản hơn trong hệ thống tác nhân phụ. Trong khi GPT-5.4 Mini có sẵn trên API, Codex và ChatGPT, thì GPT-5.4 Nano hiện chỉ được cung cấp độc quyền qua API. Về mặt định giá qua API, GPT-5.4 Mini được niêm yết ở mức 0,75 USD cho một triệu token đầu vào và 4,50 USD cho một triệu token đầu ra, trong khi GPT-5.4 Nano có giá 0,20 USD cho đầu vào và 1,25 USD cho đầu ra trên một triệu token.
Mặc dù hiệu suất trên mỗi độ trễ được cải thiện, các mô hình mới này đi kèm với mức tăng giá đáng kể so với các phiên bản GPT-5 trước đó; ví dụ, GPT-5.4 Mini đắt hơn gấp ba lần cho token đầu vào so với GPT-5 Mini. Tuy nhiên, việc áp dụng các mô hình nhỏ hơn này trong các hệ thống tác nhân có thể mang lại lợi ích kinh tế đáng kể khi một quy trình tạo ra 200 triệu token đầu ra hàng tháng có thể tiết kiệm chi phí đáng kể so với việc sử dụng mô hình lớn hơn. Sự xuất hiện của các mô hình này củng cố quan điểm rằng năm 2026 là năm của các quy trình làm việc AI chuyên biệt hơn là các tác nhân tự trị hoàn toàn.
Sự ra mắt này tiếp nối việc OpenAI giới thiệu mô hình chủ lực GPT-5.4 Thinking vào ngày 5 tháng 3 năm 2026, cho thấy một chuỗi phát hành nhanh chóng các công cụ AI được tinh chỉnh. Các mô hình mới này cũng được triển khai trong Microsoft Foundry, cho phép các nhà phát triển truy cập các mô hình OpenAI cùng với các mô hình của bên thứ ba trong một nền tảng thống nhất, cho thấy sự tích hợp sâu rộng của các công nghệ này vào cơ sở hạ tầng doanh nghiệp.
6 Lượt xem
Nguồn
Republic World
Mynet Haber
OpenAI ships GPT-5.4 mini and nano, faster and more capable but up to 4x pricier
OpenAI has announced 'GPT-5.4 mini/nano,' a fast, low-cost, and lightweight model
OpenAI 2026 AI Roadmap: GPT-5, 5.2 & Open Models - i10X
OpenAI's Latest AI Models Are Built for Speed - CNET
OpenAI releases GPT-5.4 mini and nano, its most capable small models yet
9to5Mac
ZDNET
OpenAI
Thurrott.com
Microsoft
Đọc thêm tin tức về chủ đề này:
Bạn có phát hiện lỗi hoặc sai sót không?Chúng tôi sẽ xem xét ý kiến của bạn càng sớm càng tốt.



