Компания DeepSeek выпустила свои основные модели DeepSeek-R1-Zero и DeepSeek-R1, а также шесть небольших дистиллированных версий с диапазоном от 1,5 млрд до 70 млрд параметров. Эти новые модели, основанные на архитектурах с открытым исходным кодом, таких как Qwen и Llama, используют данные, полученные из полной модели R1.
Самая маленькая модель может работать на ноутбуке, в то время как полная версия требует значительных вычислительных мощностей. Этот релиз привлек значительное внимание сообщества ИИ, поскольку многие существующие модели с открытым весом не смогли сравниться с собственными моделями, такими как o1 от OpenAI, в тестах на логику.
Независимый исследователь ИИ Саймон Уиллисон подчеркнул уникальные способности моделей к рассуждениям, отметив, что даже простые подсказки вызывают обширные рассуждения.
Модель R1 отличается тем, что использует подход к рассуждениям в режиме вывода, имитируя человекоподобный мыслительный процесс для решения запросов. Этот инновационный класс моделей, получивший название simulated reasoning (SR), получил широкое распространение после выхода семейства моделей o1 от OpenAI в сентябре 2024 года.