ByteDance i DeepSeek podnoszą poprzeczkę w rozwoju sztucznej inteligencji, wzmacniając sektor technologiczny Chin

Edytowane przez: gaya ❤️ one

W sierpniu 2025 roku chiński gigant technologiczny ByteDance, znany przede wszystkim jako właściciel platformy TikTok, zaprezentował trzy nowe warianty swojego otwartego modelu sztucznej inteligencji Seed-OSS-36B. Modele te wyróżniają się zdolnością do przetwarzania bardzo długich sekwencji danych (long-context window) i zostały zaprojektowane z myślą o łatwości użytkowania przez deweloperów. Jednocześnie, chiński startup specjalizujący się w dziedzinie sztucznej inteligencji, DeepSeek, ogłosił premierę zmodernizowanej wersji swojego modelu DeepSeek-V3.1. Ta nowa iteracja charakteryzuje się hybrydową strukturą wnioskowania, zwiększoną prędkością przetwarzania oraz ulepszonymi zdolnościami w zakresie działania jako agent (agent capabilities).

Model Seed-OSS-36B firmy ByteDance w testach porównawczych (benchmarkach) osiągnął wyniki konkurencyjne, dorównując lub przewyższając podobne modele opracowane przez globalnych liderów technologicznych. To osiągnięcie podkreśla rosnącą siłę i znaczenie chińskich modeli sztucznej inteligencji na arenie międzynarodowej. ByteDance udostępnił te modele na licencji Apache 2.0, co umożliwia ich swobodne wykorzystanie zarówno w badaniach akademickich, jak i w zastosowaniach komercyjnych. Model ten oferuje natywną obsługę kontekstu o długości 512 tysięcy tokenów, co stanowi czterokrotne zwiększenie w porównaniu do standardów rynkowych, takich jak 128 tysięcy tokenów w modelu DeepSeek V3.1. Dodatkowo, Seed-OSS wprowadza mechanizm „budżetu myślowego”, pozwalający na kontrolowanie głębokości rozumowania modelu poprzez ustawienie limitu tokenów, co umożliwia zrównoważenie szybkości odpowiedzi z precyzją analizy.

Z kolei DeepSeek-V3.1 został zoptymalizowany pod kątem współpracy z chińskimi procesorami, co stanowi znaczący krok dla krajowego przemysłu półprzewodnikowego. Ta optymalizacja, wykorzystująca format precyzji UE8M0 FP8, ma na celu zapewnienie efektywnej współpracy z nadchodzącymi procesorami krajowych producentów. Model ten oferuje również elastyczność w zakresie formatów precyzji, obsługując BF16, FP8 i F32, co pozwala na optymalizację wydajności w zależności od dostępnego sprzętu. DeepSeek-V3.1 posiada 128 tysięcy tokenów okna kontekstowego i integruje funkcje konwersacyjne, rozumowanie i generowanie kodu w jednym, hybrydowym modelu. Jest to znaczące ulepszenie w stosunku do poprzednich generacji, które często specjalizowały się w jednej dziedzinie.

Wzmianka o „UE8M0 FP8” w kontekście modelu DeepSeek-V3.1 sugeruje postęp w koordynacji sprzętowo-programowej, co może być kluczowe dla chińskiego sektora AI w obliczu ograniczeń eksportowych na zaawansowane chipy ze strony USA. Informacje te wywołały wzrosty na chińskich giełdach półprzewodników, co świadczy o pozytywnym odbiorze tych innowacji przez rynek. Postęp ten wpisuje się w szerszy trend chińskiej strategii samowystarczalności technologicznej, mającej na celu zmniejszenie zależności od zagranicznych dostawców w kluczowych obszarach, takich jak półprzewodniki. Sam Altman, dyrektor generalny OpenAI, wyraził zaniepokojenie tempem rozwoju chińskiej sztucznej inteligencji, podkreślając, że postęp Chin, zwłaszcza w modelach open-source, wpłynął na decyzje OpenAI o udostępnieniu własnych modeli. W obliczu tych wydarzeń, chiński sektor technologiczny, napędzany przez innowacje w dziedzinie sztucznej inteligencji, umacnia swoją pozycję jako globalny gracz, demonstrując zdolność do szybkiego wdrażania zaawansowanych rozwiązań i stawiając wyzwanie dominacji zachodnich firm.

Źródła

  • Asianet News Network Pvt Ltd

  • Reuters

  • Financial Times

  • CNBC

Czy znalazłeś błąd lub niedokładność?

Rozważymy Twoje uwagi tak szybko, jak to możliwe.