Chiński deweloper sztucznej inteligencji, DeepSeek, ogłosił wprowadzenie swojego najnowszego eksperymentalnego modelu, DeepSeek-V3.2-Exp, który znacząco usprawnia przetwarzanie długich sekwencji tekstowych. Jednocześnie firma obniżyła ceny swojego API dla deweloperów o ponad 50%, co ma na celu umocnienie jej pozycji na rynku poprzez oferowanie bardziej dostępnych i zaawansowanych rozwiązań.
Nowy model, DeepSeek-V3.2-Exp, opiera się na architekturze V3.1-Terminus i wprowadza innowacyjną technologię DeepSeek Sparse Attention (DSA). Mechanizm ten pozwala na selektywne obliczanie wag uwagi, co drastycznie redukuje złożoność obliczeniową i zapotrzebowanie na pamięć, szczególnie podczas pracy z długimi tekstami. Jest to kluczowe w obliczu rosnącego zapotrzebowania na przetwarzanie obszernych danych w aplikacjach AI. Pomimo tych usprawnień, model zachowuje jakość wyników porównywalną do swojego poprzednika, V3.1-Terminus, co potwierdzają testy na publicznych benchmarkach. Firma określa ten eksperymentalny model jako "krok pośredni w kierunku naszej architektury nowej generacji", wskazując na ciągłe badania i rozwój w kierunku bardziej zaawansowanych rozwiązań. Wprowadzenie DSA stanowi ważny kierunek ewolucji architektur dużych modeli, zwiększając ich efektywność i potencjalnie możliwości w specyficznych zadaniach, takich jak rozumowanie matematyczne czy kodowanie.
Obniżka cen API o ponad 50% jest znaczącym posunięciem strategicznym DeepSeek, mającym na celu demokratyzację dostępu do zaawansowanych technologii AI. Koszt wejścia dla deweloperów i firm został obniżony, co może przyspieszyć innowacje w różnych sektorach. Na przykład, koszt wejścia przy trafieniu w pamięć podręczną spadł z 0,5 CNY za milion tokenów do 0,2 CNY, a koszt wyjścia z 12 CNY do 3 CNY za milion tokenów. Wcześniejsze obniżki cen API przez DeepSeek, w tym te z lutego 2025 roku, już czyniły ofertę firmy atrakcyjną w porównaniu do konkurencji, takiej jak OpenAI GPT-4o.
DeepSeek, jako chiński deweloper sztucznej inteligencji, działa w dynamicznie rozwijającym się ekosystemie technologicznym Chin, gdzie inwestycje w AI i rozwój modeli językowych osiągają rekordowe poziomy. Chiny dążą do pozycji globalnego lidera w dziedzinie AI, wspierając badania i rozwój zarówno poprzez środki rządowe, jak i inwestycje prywatne. Platformy takie jak Hugging Face odgrywają kluczową rolę w udostępnianiu i dyskusji na temat nowych modeli AI, umożliwiając społeczności deweloperów szybkie testowanie i wdrażanie innowacji. Ogłoszony model DeepSeek-V3.2-Exp i obniżka cen API wpisują się w ten trend, oferując społeczności narzędzia, które mogą napędzać dalszy postęp i tworzenie nowych aplikacji opartych na sztucznej inteligencji.