27 января 2025 года - DeepSeek, китайский стартап в области ИИ, привлек внимание после выпуска своей новой модели языка R1 20 января. Модель быстро поднялась на вершину списка бесплатных приложений App Store от Apple, удивив лидеров отрасли в Силиконовой долине.
R1 от DeepSeek предназначен для решения сложных задач и был разработан с значительно меньшими затратами по сравнению с моделями таких компаний, как OpenAI и Meta. Компания сообщила, что построила и обучила свою модель V3 за менее чем 6 миллионов долларов, используя около 2000 чипов Nvidia H800, которые менее мощные, чем предпочитаемые американскими фирмами чипы H100.
Несмотря на ограничения, вызванные санкциями США, которые препятствуют доступу к современным чипам, результаты DeepSeek впечатляют. Эксперты отрасли отметили быстрый прогресс стартапа, а Марк Андриссен, венчурный капиталист из Силиконовой долины, назвал R1 'глубоким даром миру' и сравнил его с 'моментом Спутника' для ИИ.
Главный ученый ИИ Meta, Ян ЛеКун, подчеркнул важность моделей с открытым исходным кодом, заявив, что успех DeepSeek подчеркивает преимущества открытых исследований. Meta недавно объявила о планах инвестировать более 60 миллиардов долларов в развитие ИИ в 2025 году, стремясь сохранить конкурентоспособность в меняющемся ландшафте.
Хотя технологии DeepSeek все еще считаются отстающими от OpenAI и Google, они завоевывают популярность, а их модели входят в десятку лучших на платформе Chatbot Arena, которая оценивает производительность.