ByteDance Ra Mắt Seed-OSS-36B: Mô Hình Ngôn Ngữ Lớn Mã Nguồn Mở Đột Phá Với Khả Năng Xử Lý 512K Token

Chỉnh sửa bởi: Veronika Radoslavskaya

Vào ngày 20 tháng 8 năm 2025, ByteDance, tập đoàn công nghệ đứng sau TikTok, đã công bố và phát hành Seed-OSS-36B, một mô hình ngôn ngữ lớn (LLM) mã nguồn mở mang tính cách mạng. Mô hình này nổi bật với cửa sổ ngữ cảnh gốc lên tới 512.000 token, một cơ chế "ngân sách suy nghĩ" linh hoạt cho phép nhà phát triển kiểm soát độ sâu của lý luận, và các khả năng nâng cao cho việc giải quyết vấn đề phức tạp cũng như sử dụng công cụ.

Sự ra mắt này đánh dấu một bước tiến quan trọng trong lĩnh vực AI mã nguồn mở, cung cấp một giải pháp thay thế mạnh mẽ và linh hoạt cho các mô hình độc quyền. Seed-OSS-36B được cung cấp dưới dạng ba biến thể: seed-36b-base (sử dụng dữ liệu tổng hợp), seed-36b-base (không sử dụng dữ liệu tổng hợp) và seed-36b-instruct. Phiên bản sử dụng dữ liệu tổng hợp cho thấy điểm số vượt trội trên các bài kiểm tra hiệu năng, đạt 65,1 trên MMLU-Pro, cao hơn đáng kể so với 58,5 của Alibaba. Các chỉ số ấn tượng khác bao gồm điểm 82,1 trên TriviaQA và kỷ lục mới cho các mô hình mã nguồn mở trên BBH Benchmark với 87,7. Ngoài ra, mô hình còn đạt điểm 90,8 trên GSM8K và 81,7 trên MATH, cùng với 76,8 trên HumanEval, thể hiện năng lực vượt trội trong nhiều lĩnh vực.

Việc ByteDance phát hành Seed-OSS-36B dưới giấy phép Apache-2.0 cho phép sử dụng, sửa đổi và phân phối miễn phí cho cả mục đích nghiên cứu và thương mại. Điều này thúc đẩy sự đổi mới và cạnh tranh trong ngành AI, cho phép các nhà phát triển và nhà nghiên cứu truy cập vào công nghệ tiên tiến mà không gặp rào cản về chi phí hoặc giấy phép. Giấy phép Apache 2.0 cũng mang lại sự bảo vệ về quyền sở hữu trí tuệ, giúp các nhà phát triển yên tâm hơn khi tích hợp mô hình vào các dự án của họ.

Sự ra đời của Seed-OSS-36B phản ánh xu hướng ngày càng tăng của các công ty công nghệ Trung Quốc trong việc thu hẹp khoảng cách với các đối thủ Mỹ thông qua cách tiếp cận mã nguồn mở. Bằng cách cung cấp các mô hình mạnh mẽ và linh hoạt, ByteDance không chỉ củng cố vị thế của mình trong lĩnh vực AI mà còn đóng góp vào việc dân chủ hóa các khả năng AI tiên tiến. Khả năng xử lý ngữ cảnh dài và cơ chế "ngân sách suy nghĩ" có thể tùy chỉnh của Seed-OSS-36B mang lại lợi thế cạnh tranh đáng kể, cho phép các nhà phát triển tạo ra các ứng dụng AI hiệu quả và thông minh hơn, từ phân tích tài liệu chuyên sâu đến các quy trình làm việc phức tạp của tác nhân AI. Sự kiện này nhấn mạnh tầm quan trọng của các mô hình mã nguồn mở trong việc thúc đẩy sự hợp tác và đổi mới trong cộng đồng AI toàn cầu. Với hiệu suất mạnh mẽ và giấy phép mở, Seed-OSS-36B hứa hẹn sẽ là một công cụ có giá trị cho các nhà nghiên cứu và nhà phát triển, góp phần định hình tương lai của trí tuệ nhân tạo.

Nguồn

  • News Directory 3

  • VentureBeat

  • AInvest

  • 36Kr

  • Communeify

  • Hugging Face

Bạn có phát hiện lỗi hoặc sai sót không?

Chúng tôi sẽ xem xét ý kiến của bạn càng sớm càng tốt.