DeepSeek Startet R1-Modell und Konkurrenziert mit Großen KI-Firmen

Bearbeitet von: Olga Sukhina

27. Januar 2025 - DeepSeek, ein chinesisches KI-Startup, sorgt nach der Veröffentlichung seines neuen Sprachmodells R1 am 20. Januar für Aufsehen. Das Modell stieg schnell an die Spitze der kostenlosen Apps im Apple App Store und überraschte die Branchenführer in Silicon Valley.

Das R1 von DeepSeek ist für komplexe Problemlösungen konzipiert und wurde zu einem deutlich niedrigeren Preis entwickelt als die Modelle etablierter Unternehmen wie OpenAI und Meta. Das Unternehmen gab an, sein V3-Modell für weniger als 6 Millionen Dollar mit etwa 2.000 Nvidia H800-Chips gebaut und trainiert zu haben, die weniger leistungsstark sind als die von den US-Firmen bevorzugten H100-Chips.

Trotz der Einschränkungen durch US-Sanktionen, die den Zugang zu fortschrittlichen Chips verhindern, sind die Leistungen von DeepSeek bemerkenswert. Branchenexperten haben die schnellen Fortschritte des Startups anerkannt, wobei Marc Andreessen, ein Risikokapitalgeber aus Silicon Valley, das R1 als 'tiefgreifendes Geschenk an die Welt' bezeichnete und es mit einem 'Sputnik-Moment' für KI verglich.

Der Chief AI Scientist von Meta, Yann LeCun, betonte die Bedeutung von Open-Source-Modellen und erklärte, dass der Erfolg von DeepSeek die Vorteile offener Forschung unterstreicht. Meta kündigte kürzlich an, über 60 Milliarden Dollar in die KI-Entwicklung für 2025 zu investieren, um die Wettbewerbsfähigkeit in der sich wandelnden Landschaft aufrechtzuerhalten.

Die Technologie von DeepSeek wird zwar als hinter der von OpenAI und Google stehend angesehen, gewinnt jedoch an Boden, wobei ihre Modelle in den Top 10 der Chatbot Arena, einer Plattform zur Leistungsbewertung, eingestuft werden.

Haben Sie einen Fehler oder eine Ungenauigkeit festgestellt?

Wir werden Ihre Kommentare so schnell wie möglich berücksichtigen.