DeepSeek Ulepsza Swój Model AI i Obniża Ceny API

15:16, 29 września

Edytowane przez: Татьяна Гуринович

Chiński deweloper sztucznej inteligencji, DeepSeek, ogłosił wprowadzenie swojego najnowszego eksperymentalnego modelu, DeepSeek-V3.2-Exp, który znacząco usprawnia przetwarzanie długich sekwencji tekstowych. Jednocześnie firma obniżyła ceny swojego API dla deweloperów o ponad 50%, co ma na celu umocnienie jej pozycji na rynku poprzez oferowanie bardziej dostępnych i zaawansowanych rozwiązań.

Nowy model, DeepSeek-V3.2-Exp, opiera się na architekturze V3.1-Terminus i wprowadza innowacyjną technologię DeepSeek Sparse Attention (DSA). Mechanizm ten pozwala na selektywne obliczanie wag uwagi, co drastycznie redukuje złożoność obliczeniową i zapotrzebowanie na pamięć, szczególnie podczas pracy z długimi tekstami. Jest to kluczowe w obliczu rosnącego zapotrzebowania na przetwarzanie obszernych danych w aplikacjach AI. Pomimo tych usprawnień, model zachowuje jakość wyników porównywalną do swojego poprzednika, V3.1-Terminus, co potwierdzają testy na publicznych benchmarkach. Firma określa ten eksperymentalny model jako "krok pośredni w kierunku naszej architektury nowej generacji", wskazując na ciągłe badania i rozwój w kierunku bardziej zaawansowanych rozwiązań. Wprowadzenie DSA stanowi ważny kierunek ewolucji architektur dużych modeli, zwiększając ich efektywność i potencjalnie możliwości w specyficznych zadaniach, takich jak rozumowanie matematyczne czy kodowanie.

Obniżka cen API o ponad 50% jest znaczącym posunięciem strategicznym DeepSeek, mającym na celu demokratyzację dostępu do zaawansowanych technologii AI. Koszt wejścia dla deweloperów i firm został obniżony, co może przyspieszyć innowacje w różnych sektorach. Na przykład, koszt wejścia przy trafieniu w pamięć podręczną spadł z 0,5 CNY za milion tokenów do 0,2 CNY, a koszt wyjścia z 12 CNY do 3 CNY za milion tokenów. Wcześniejsze obniżki cen API przez DeepSeek, w tym te z lutego 2025 roku, już czyniły ofertę firmy atrakcyjną w porównaniu do konkurencji, takiej jak OpenAI GPT-4o.

DeepSeek, jako chiński deweloper sztucznej inteligencji, działa w dynamicznie rozwijającym się ekosystemie technologicznym Chin, gdzie inwestycje w AI i rozwój modeli językowych osiągają rekordowe poziomy. Chiny dążą do pozycji globalnego lidera w dziedzinie AI, wspierając badania i rozwój zarówno poprzez środki rządowe, jak i inwestycje prywatne. Platformy takie jak Hugging Face odgrywają kluczową rolę w udostępnianiu i dyskusji na temat nowych modeli AI, umożliwiając społeczności deweloperów szybkie testowanie i wdrażanie innowacji. Ogłoszony model DeepSeek-V3.2-Exp i obniżka cen API wpisują się w ten trend, oferując społeczności narzędzia, które mogą napędzać dalszy postęp i tworzenie nowych aplikacji opartych na sztucznej inteligencji.

Źródła

Valor Econômico
DeepSeek API Docs

Przeczytaj więcej wiadomości na ten temat:

01 października

USA umieszcza Szwajcarię na liście obserwacyjnej walut; Bessent podkreśla walkę z nieuczciwymi praktykami

30 września

Diamenty stworzone w laboratorium zdobywają rynek w 2025 roku, napędzane przez młodsze pokolenia i przystępność cenową

30 września

Niemcy otwierają pierwszą publiczną stację ładowania Megawatt Charging System dla ciężarówek elektrycznych

Czy znalazłeś błąd lub niedokładność?

Rozważymy Twoje uwagi tak szybko, jak to możliwe.

Centrum powiadomień

Centrum powiadomień

DeepSeek Ulepsza Swój Model AI i Obniża Ceny API

Źródła

Przeczytaj więcej wiadomości na ten temat: