DeepSeek Stellt Neue KI-Modelle mit Verbesserter Denkfähigkeit Vor

Bearbeitet von: Veronika Nazarova

DeepSeek hat seine Hauptmodelle DeepSeek-R1-Zero und DeepSeek-R1 sowie sechs kleinere distillierte Versionen mit 1,5 bis 70 Milliarden Parametern veröffentlicht. Diese neuen Modelle basieren auf Open-Source-Architekturen wie Qwen und Llama und nutzen Daten, die vom vollständigen R1-Modell generiert wurden.

Das kleinste Modell kann auf einem Laptop betrieben werden, während die Vollversion erhebliche Rechenressourcen erfordert. Diese Veröffentlichung hat in der KI-Community großes Interesse geweckt, da viele bestehende Open-Weight-Modelle Schwierigkeiten haben, mit proprietären Modellen wie OpenAIs o1 in Bezug auf Denkbenchmarks Schritt zu halten.

Das R1-Modell zeichnet sich durch den Einsatz eines Denkansatzes in der Inferenzzeit aus, der einen menschenähnlichen Denkprozess simuliert, um Anfragen zu lösen. Diese innovative Klasse von Modellen, die als simuliertes Denken (SR) bezeichnet wird, gewann an Bedeutung nach der Veröffentlichung der o1-Modellfamilie von OpenAI im September 2024.

Haben Sie einen Fehler oder eine Ungenauigkeit festgestellt?

Wir werden Ihre Kommentare so schnell wie möglich berücksichtigen.