OpenAI ra mắt GPT-5.4: Bước tiến đột phá với khả năng điều khiển máy tính và tích hợp tài chính chuyên sâu

Chỉnh sửa bởi: Veronika Radoslavskaya

Vào đầu tháng 3 năm 2026, OpenAI đã chính thức tạo nên một cột mốc mới trong ngành công nghiệp trí tuệ nhân tạo khi trình làng GPT-5.4, một mô hình ngôn ngữ lớn đa năng với những cải tiến vượt bậc. Sự ra mắt này không chỉ đơn thuần là một bản cập nhật về hiệu suất mà còn đánh dấu một bước chuyển mình chiến lược của công ty hướng tới các quy trình làm việc dạng tác nhân (agentic workflows) và khả năng vận hành phần mềm một cách trực tiếp. GPT-5.4 là sự hội tụ tinh hoa từ khả năng suy luận logic chuyên sâu, các kỹ năng lập trình tiên tiến được kế thừa từ phiên bản GPT-5.3-Codex, cùng với tính năng tương tác máy tính hoàn toàn mới. Mô hình được triển khai thông qua hai biến thể chuyên biệt là GPT-5.4 Thinking, tối ưu cho các tác vụ tư duy phức tạp, và GPT-5.4 Pro, dành cho các yêu cầu hiệu năng cao nhất.

Điểm nhấn công nghệ đáng chú ý nhất của GPT-5.4 chính là khả năng vận hành máy tính một cách bản địa, cho phép AI trực tiếp quan sát và diễn giải các hình ảnh chụp màn hình để đưa ra các quyết định xử lý. Thông qua việc sử dụng các thư viện điều khiển như Playwright, mô hình có thể tự thực hiện các thao tác chuột và bàn phím ảo để hoàn thành công việc trên các giao diện phần mềm khác nhau. Trong các bài kiểm tra thực tế trên hệ thống chuẩn OSWorld-Verified, GPT-5.4 đã thiết lập một kỷ lục mới với tỷ lệ thành công lên tới 75,0%, chính thức vượt qua ngưỡng năng lực của con người là 72,4% và cải thiện vượt bậc so với con số 47,3% của thế hệ GPT-5.2 trước đó. Bên cạnh đó, độ tin cậy của hệ thống cũng được củng cố mạnh mẽ; các dữ liệu thống kê chỉ ra rằng các tuyên bố thực tế từ mô hình này ít có khả năng sai sót hơn 33% so với GPT-5.2, trong khi tổng số lỗi trong toàn bộ câu trả lời đã giảm được 18%.

Chiến lược thương mại hóa của OpenAI lần này tập trung trọng tâm vào các ứng dụng doanh nghiệp có giá trị thặng dư cao, đặc biệt là việc tích hợp sâu vào các hệ sinh thái phần mềm tài chính chuyên dụng. Một ví dụ điển hình là việc phát hành bản thử nghiệm ChatGPT cho Microsoft Excel dưới dạng một tiện ích bổ sung (add-in) tích hợp ngay tại thanh bên của ứng dụng. Công cụ này cho phép các chuyên gia tài chính thực hiện các công việc phức tạp như xây dựng, kiểm toán và cập nhật các mô hình định giá chỉ bằng cách sử dụng ngôn ngữ tự nhiên. Trí tuệ nhân tạo sẽ tự động liên kết các hành động với từng ô dữ liệu cụ thể trong bảng tính, đồng thời luôn duy trì cơ chế yêu cầu người dùng xác nhận trước khi thực hiện bất kỳ thay đổi quan trọng nào, đảm bảo tính minh bạch và kiểm soát tối đa.

Hơn thế nữa, GPT-5.4 còn được tối ưu hóa để xử lý và tích hợp các nguồn dữ liệu tổ chức khổng lồ, từ dữ liệu thị trường trực tuyến, hồ sơ pháp lý của các công ty cho đến các báo cáo nghiên cứu chuyên sâu, phục vụ đắc lực cho quy trình định giá và thẩm định rủi ro. Đối với cộng đồng các nhà phát triển, giao diện lập trình ứng dụng (API) của OpenAI hiện đã hỗ trợ cửa sổ ngữ cảnh cực lớn lên đến 1 triệu token, cho phép nạp toàn bộ kho mã nguồn hoặc các bộ tài liệu kỹ thuật đồ sộ vào một lần xử lý duy nhất. Tuy nhiên, người dùng cần lưu ý rằng cơ chế tính phí gấp đôi sẽ được áp dụng cho các đầu vào vượt quá ngưỡng 272.000 token. Để hỗ trợ quản lý chi phí và tài nguyên tính toán, tính năng Tìm kiếm Công cụ (Tool Search) mới trong API đã giúp giảm thiểu khoảng 47% lượng token tiêu thụ trong các tác vụ sử dụng công cụ phức tạp theo các kết quả thử nghiệm nội bộ.

Về mặt hiệu quả công việc tổng quát, GPT-5.4 đã chứng minh năng lực vượt trội với tỷ lệ thành công 83,0% trên thang đo GDPval áp dụng cho 44 ngành nghề khác nhau, tăng đáng kể so với mức 71,0% của phiên bản GPT-5.2. Sự xuất hiện của mô hình này chắc chắn sẽ làm nóng thêm cuộc đua công nghệ với các đối thủ nặng ký như Anthropic, đặc biệt là trong phân khúc khách hàng thuộc lĩnh vực tài chính và ngân hàng. Về chính sách giá, API GPT-5.4 Thinking được niêm yết ở mức 2,50 USD cho mỗi triệu token đầu vào và 15 USD cho mỗi triệu token đầu ra, trong khi biến thể Pro sẽ có mức giá cao hơn tương ứng với năng lực xử lý. OpenAI cũng đưa ra nhận định rằng hiệu quả sử dụng token được cải thiện sẽ giúp tối ưu hóa chi phí cho các doanh nghiệp triển khai hệ thống phức tạp, đồng thời xác nhận rằng mô hình GPT-5.2 Thinking hiện tại sẽ bắt đầu lộ trình ngừng hoạt động dần dần trong suốt năm 2026.

4 Lượt xem

Nguồn

  • WinBuzzer

  • OpenAI. GPT-5.4 Targets Anthropic's Claude With Premium Pricing and Coding Muscle

  • GPT-5.4 - Wikipedia

  • GPT-5.4 API Officially Launched: 1 Million Token Context Window, Native Computer Control, and 5 Core Capabilities Explained - Apiyi.com Blog

  • No Week Without a Major Release: OpenAI's GPT-5.4 Elevates AI Autonomy and Agency

Đọc thêm tin tức về chủ đề này:

Bạn có phát hiện lỗi hoặc sai sót không?Chúng tôi sẽ xem xét ý kiến của bạn càng sớm càng tốt.