OpenAI đã công bố hai mô hình ngôn ngữ mã nguồn mở mới, gpt-oss-120b và gpt-oss-20b, được thiết kế để thực hiện các tác vụ lý luận phức tạp và hoạt động hiệu quả.
Các mô hình này hiện đã có mặt trên các nền tảng như Amazon Web Services (AWS), bao gồm Amazon Bedrock và Amazon SageMaker AI. GPT-OSS đánh dấu một cột mốc quan trọng, thể hiện nỗ lực của OpenAI trong việc tăng cường tính minh bạch và khả năng kiểm soát trong lĩnh vực phát triển AI.
GPT-OSS bao gồm hai mô hình: gpt-oss-120b với 117 tỷ tham số và gpt-oss-20b với 21 tỷ tham số. Cả hai đều là các mô hình mixture-of-experts (MoE) và sử dụng sơ đồ lượng tử hóa 4-bit (MXFP4), cho phép suy luận nhanh. GPT-oss-120b có thể chạy trên một GPU duy nhất, trong khi gpt-oss-20b có thể chạy trên các thiết bị có 16GB bộ nhớ.
Các mô hình này được đào tạo trên một tập dữ liệu văn bản, tập trung vào khoa học, toán học và mã hóa. Chúng vượt trội trong các lĩnh vực như mã hóa, toán học và các truy vấn liên quan đến sức khỏe.
Theo một báo cáo của McKinsey, AI tạo sinh có thể mang lại giá trị kinh tế từ 2,6 nghìn tỷ đến 4,4 nghìn tỷ đô la hàng năm trên toàn cầu.
Việc sử dụng các mô hình mã nguồn mở như gpt-oss-120b và gpt-oss-20b có thể giúp các tổ chức giảm sự phụ thuộc vào các nhà cung cấp AI độc quyền và tăng cường khả năng tùy chỉnh các ứng dụng AI của họ.
Theo Forbes, việc các công ty mở rộng sử dụng AI cũng làm dấy lên lo ngại về sự thay đổi trong thị trường lao động.
OpenAI đã thử nghiệm một phiên bản tinh chỉnh độc hại của gpt-oss-120b theo Khung chuẩn bị và thấy rằng nó không đạt đến mức khả năng cao.