OpenAI Đang Phát Triển Mô Hình Chuyên Biệt 'Garlic': Đạt Hiệu Suất Tiên Phong Với Khả Năng Mở Rộng Hiệu Quả

Chỉnh sửa bởi: Veronika Radoslavskaya

OpenAI được cho là đang trong quá trình phát triển một mô hình ngôn ngữ lớn (LLM) mới với tên mã là 'Garlic'. Đây là một bước đi chiến lược quan trọng, đánh dấu sự chuyển hướng sang các ngành công nghiệp chuyên biệt, mang lại giá trị cao, đồng thời tối ưu hóa hiệu quả mở rộng cho nền tảng người tiêu dùng cốt lõi của họ. Mô hình 'Garlic' này được thiết kế nhằm khắc phục những vấn đề về cấu trúc đã gặp phải ở các phiên bản trước, với mục tiêu tích hợp kiến thức và sức mạnh suy luận của các mô hình lớn hơn vào một kiến trúc nhỏ gọn và hiệu quả hơn nhiều.

Dự án 'Garlic' được xây dựng dựa trên những bài học kinh nghiệm quý báu rút ra từ mô hình nội bộ trước đó có tên là Shallotpeat. Trọng tâm chính của đội ngũ phát triển là giải quyết các nút thắt kỹ thuật quan trọng trong giai đoạn tiền huấn luyện. Ông Mark Chen, Giám đốc Nghiên cứu, khẳng định rằng nhóm đã đạt được một bước đột phá lớn về hiệu suất. Họ đã thành công trong việc gói gọn cơ sở tri thức thường đòi hỏi số lượng tham số khổng lồ vào một mô hình nhỏ hơn và hoạt động nhanh hơn. Tiến bộ này cực kỳ quan trọng đối với OpenAI, vì nó mở ra một lộ trình linh hoạt và tiết kiệm chi phí hơn để cung cấp các khả năng tiên tiến mà không làm tăng vọt chi phí huấn luyện và suy luận.

Các đánh giá nội bộ cho thấy 'Garlic' đã thể hiện hiệu suất ấn tượng khi so sánh với các mô hình tiên phong hiện tại. Có thông tin cho rằng 'Garlic' đang đạt được những kết quả đáng kinh ngạc khi đối đầu với Gemini 3 của Google và Claude Opus 4.5 của Anthropic, đặc biệt trong các trường hợp sử dụng mang lại giá trị cao như lập trình và các tác vụ suy luận nâng cao. Sự xuất hiện của trí tuệ chuyên biệt này báo hiệu sự dịch chuyển của OpenAI sang các ứng dụng tập trung sâu hơn, ví dụ như y sinh và chăm sóc sức khỏe.

Mô hình này dự kiến sẽ trải qua quá trình kiểm tra an toàn nghiêm ngặt sau huấn luyện và có thể được công bố rộng rãi dưới tên gọi GPT-5.2 hoặc GPT-5.5 vào đầu năm 2026. Động thái tập trung vào hiệu suất này hoàn toàn phù hợp với định hướng nội bộ của CEO Sam Altman, nhằm mục đích cấp bách tăng cường khả năng phản hồi và các tính năng cá nhân hóa của ChatGPT, từ đó nâng cao trải nghiệm người dùng trên phạm vi toàn cầu.

Nguồn

  • Analytics Insight

  • The Indian Express

  • Times Now

  • Google Blog

  • Reddit (r/OpenAI)

Bạn có phát hiện lỗi hoặc sai sót không?

Chúng tôi sẽ xem xét ý kiến của bạn càng sớm càng tốt.