DeepSeek Lanza el Modelo R1 y Compite con Grandes Empresas de IA

Editado por: Olga Sukhina

27 de enero de 2025 - DeepSeek, una startup china de IA, ha causado sensación tras el lanzamiento de su nuevo modelo de lenguaje, R1, el 20 de enero. El modelo rápidamente ascendió a la cima de la lista de aplicaciones gratuitas de la App Store de Apple, sorprendiendo a los líderes de la industria en Silicon Valley.

El R1 de DeepSeek está diseñado para resolver problemas complejos y se ha desarrollado a un costo significativamente más bajo en comparación con los modelos de empresas establecidas como OpenAI y Meta. La compañía informó que construyó y entrenó su modelo V3 por menos de 6 millones de dólares utilizando aproximadamente 2,000 chips Nvidia H800, que son menos potentes que los chips H100 preferidos por las empresas estadounidenses.

A pesar de las limitaciones debido a las sanciones estadounidenses que impiden el acceso a chips avanzados, el rendimiento de DeepSeek es notable. Expertos de la industria han reconocido los rápidos avances de la startup, con Marc Andreessen, un capitalista de riesgo de Silicon Valley, llamando al R1 un 'don profundo para el mundo' y comparándolo con un 'momento Sputnik' para la IA.

El Científico Jefe de IA de Meta, Yann LeCun, enfatizó la importancia de los modelos de código abierto, afirmando que el éxito de DeepSeek subraya las ventajas de la investigación abierta. Meta anunció recientemente planes para invertir más de 60 mil millones de dólares en el desarrollo de IA para 2025, con el objetivo de mantener la competitividad en un paisaje en evolución.

Aunque la tecnología de DeepSeek se considera aún detrás de OpenAI y Google, está ganando terreno, con sus modelos clasificados entre los 10 mejores en Chatbot Arena, una plataforma de evaluación del rendimiento.

¿Encontró un error o inexactitud?

Consideraremos sus comentarios lo antes posible.