DeepSeek Ra Mắt Mô Hình AI Thử Nghiệm DeepSeek-V3.2-Exp, Giảm Hơn 50% Giá API

Chỉnh sửa bởi: Татьяна Гуринович

DeepSeek, một nhà phát triển trí tuệ nhân tạo (AI) có trụ sở tại Trung Quốc, đã công bố ra mắt mô hình thử nghiệm mới nhất DeepSeek-V3.2-Exp vào ngày 29 tháng 9 năm 2025. Mô hình này được thiết kế để xử lý hiệu quả các chuỗi văn bản dài, đánh dấu một bước tiến quan trọng trong kiến trúc AI thế hệ tiếp theo của công ty.

DeepSeek-V3.2-Exp, được xây dựng dựa trên kiến trúc V3.1-Terminus, giới thiệu công nghệ DeepSeek Sparse Attention (DSA). Cơ chế này cho phép tính toán trọng số chú ý một cách tinh vi, giúp giảm đáng kể chi phí tính toán và yêu cầu bộ nhớ khi xử lý các văn bản dài. Các thử nghiệm cho thấy hiệu suất của V3.2-Exp tương đương với V3.1-Terminus nhưng với hiệu quả tính toán được cải thiện đáng kể. Công nghệ DSA này lần đầu tiên đạt được cơ chế chú ý thưa thớt có độ chi tiết cao, mang lại những cải thiện đáng kể về hiệu quả đào tạo và suy luận trong các tình huống ngữ cảnh dài mà gần như không ảnh hưởng đến chất lượng đầu ra của mô hình.

Cùng với việc ra mắt mô hình mới, DeepSeek cũng đã thực hiện việc cắt giảm giá đáng kể cho API dành cho nhà phát triển, giảm hơn 50%. Động thái này nhằm mục đích củng cố vị thế trên thị trường bằng cách cung cấp các giải pháp tiên tiến và dễ tiếp cận hơn, cho phép các nhà phát triển và doanh nghiệp nhỏ hơn có thể thử nghiệm và xây dựng các ứng dụng sáng tạo mà không gặp rào cản tài chính quá lớn. Việc điều chỉnh giá này có khả năng tạo áp lực cạnh tranh lên các đối thủ trong và ngoài Trung Quốc.

Sự ra mắt của DeepSeek-V3.2-Exp và việc giảm giá API diễn ra trong bối cảnh thị trường AI Trung Quốc đang phát triển mạnh mẽ. Các công ty AI Trung Quốc, bao gồm cả DeepSeek và Alibaba với dòng mô hình Qwen, đang ngày càng khẳng định vị thế trên thị trường toàn cầu, thường cung cấp hiệu suất tương đương với các mô hình hàng đầu của Mỹ với chi phí thấp hơn đáng kể. Hugging Face, một trung tâm cộng đồng AI lớn, đã chứng kiến sự gia tăng đáng kể của các mô hình mã nguồn mở từ Trung Quốc, cho thấy sự năng động và cạnh tranh trong lĩnh vực này.

DeepSeek-V3.2-Exp được coi là một bước đệm quan trọng cho kiến trúc thế hệ tiếp theo của DeepSeek, hứa hẹn những đột phá hơn nữa trong công nghệ AI. DeepSeek cũng đã công khai mã nguồn đầy đủ, các kernel CUDA và giải pháp triển khai đa nền tảng, thể hiện cam kết của họ đối với sự phát triển mở trong cộng đồng AI.

Nguồn

  • Valor Econômico

  • DeepSeek API Docs

Bạn có phát hiện lỗi hoặc sai sót không?

Chúng tôi sẽ xem xét ý kiến của bạn càng sớm càng tốt.