ByteDance và DeepSeek công bố những tiến bộ mới về mô hình AI, thúc đẩy ngành công nghệ Trung Quốc

Chỉnh sửa bởi: gaya ❤️ one

Vào tháng 8 năm 2025, bối cảnh công nghệ toàn cầu chứng kiến những bước tiến đáng kể từ hai ông lớn công nghệ Trung Quốc: ByteDance và DeepSeek. ByteDance, công ty mẹ của TikTok, đã giới thiệu ba biến thể mới của mô hình AI mã nguồn mở Seed-OSS-36B, nổi bật với khả năng xử lý ngữ cảnh dài và thân thiện với nhà phát triển. Song song đó, công ty khởi nghiệp AI DeepSeek đã công bố phiên bản nâng cấp DeepSeek-V3.1, tích hợp cấu trúc suy luận lai, tốc độ xử lý cải thiện và khả năng tác tử (agent) nâng cao, khẳng định đà phát triển vũ bão của Trung Quốc trong lĩnh vực trí tuệ nhân tạo.

Mô hình Seed-OSS-36B của ByteDance, với 36 tỷ tham số, được thiết kế để mang lại hiệu suất cạnh tranh, sánh ngang hoặc vượt trội các mô hình tương tự từ các tập đoàn công nghệ hàng đầu thế giới trong các bài kiểm tra tiêu chuẩn. Việc phát hành Seed-OSS-36B dưới giấy phép Apache-2.0 thể hiện cam kết của ByteDance đối với cộng đồng mã nguồn mở, cung cấp một nền tảng mạnh mẽ và linh hoạt cho các nhà phát triển toàn cầu. Đặc biệt, khả năng xử lý ngữ cảnh lên tới 512K token của Seed-OSS-36B mở ra những tiềm năng mới cho các ứng dụng đòi hỏi phân tích lượng lớn dữ liệu, vượt xa giới hạn thông thường của các mô hình mã nguồn mở hiện có.

Trong khi đó, DeepSeek-V3.1 đánh dấu một bước tiến quan trọng với kiến trúc suy luận lai, cho phép mô hình chuyển đổi linh hoạt giữa chế độ "suy nghĩ" và "không suy nghĩ". Phiên bản này còn được tối ưu hóa cho các chip do Trung Quốc sản xuất, sử dụng định dạng UE8M0 FP8, một động thái chiến lược nhằm thúc đẩy ngành công nghiệp bán dẫn nội địa và giảm sự phụ thuộc vào công nghệ nước ngoài. Khả năng xử lý ngữ cảnh 128K token, tốc độ xử lý nhanh hơn và hiệu suất tác tử được cải thiện giúp DeepSeek-V3.1 trở thành một đối thủ đáng gờm, đặc biệt là trong các tác vụ yêu cầu suy luận đa bước và sử dụng công cụ.

Sự ra mắt đồng thời của hai mô hình này phản ánh chiến lược của Trung Quốc trong việc thu hẹp khoảng cách công nghệ với các đối thủ phương Tây thông qua việc đẩy mạnh nghiên cứu và phát triển AI, đồng thời tận dụng sức mạnh của hệ sinh thái mã nguồn mở. Các nhà phân tích nhận định rằng những tiến bộ này không chỉ củng cố vị thế của Trung Quốc trên bản đồ AI toàn cầu mà còn thúc đẩy sự cạnh tranh lành mạnh, mang lại các giải pháp AI tiên tiến với chi phí hợp lý hơn cho doanh nghiệp và người tiêu dùng. Việc DeepSeek tối ưu hóa cho chip nội địa đã góp phần tạo nên một làn sóng tích cực, thúc đẩy giá cổ phiếu của các công ty bán dẫn Trung Quốc, cho thấy sự kết hợp chặt chẽ giữa phát triển phần mềm AI và phần cứng bản địa đang trở thành một yếu tố then chốt cho sự phát triển công nghệ của quốc gia này.

Nguồn

  • Asianet News Network Pvt Ltd

  • Reuters

  • Financial Times

  • CNBC

Bạn có phát hiện lỗi hoặc sai sót không?

Chúng tôi sẽ xem xét ý kiến của bạn càng sớm càng tốt.