DeepSeek: cómo una startup logró desafiar la burbuja de la IA y poner en jaque a la empresa más valiosa del mundo

Stiven Cartagena febrero 3, 2025

DeepSeek, la startup china de inteligencia artificial, provocó un terremoto económico, bursátil, tecnológico y geoestratégico, al lanzar su modelo DeepSeek-R1, demostrando se puede entrenar y usar de manera muchísimo más eficiente y económica, poniendo en jaque al sector tecnológico y a compañías como NVIDIA.

La inteligencia artificial emergió rápidamente como un nuevo campo de batalla para que las potencias globales demuestren su dominio. Días después de que Trump anunciara una inversión de $500 mil millones de dólares en la construcción de infraestructura de IA en todo Estados Unidos generando más de 100 mil puestos de trabajo, la startup china DeepSeek lanzó R1 desafiando el modelo de OpenAI.

«Estamos viviendo en una línea de tiempo en la que una empresa no estadounidense está manteniendo viva la misión original de OpenAI: una investigación realmente abierta y de frontera que empodera a todo», dijo Jim Fan, gerente senior de investigación y líder de IA GEAR Lab en NVIDIA.

Bruce Keith, cofundador y CEO de InvestorAi, explicó que: «DeepSeek R1 definitivamente ha desafiado el dominio de algunos jugadores en los modelos y el ecosistema de datos: OpenAI, Google y Meta lo sentirán más. R1 tendrá un impacto significativo en el panorama de la IA. El anuncio impulsa la importancia de la innovación y centrarse en las aplicaciones y los datos en lugar de solo en la potencia de procesamiento. Esto realmente democratiza la IA y da a los países que no tienen la infraestructura existente un gran salto adelante para experimentar y ser parte de la frontera».

El más barato y de código abierto

En cuestión de días, el modelo de IA construido por China ha generado un revuelo en toda la industria, superando al o1 de OpenAI, destronando a ChatGPT en la App Store, mientras que la capitalización de mercado de NVIDIA se desplomó en $589 mil millones de dólares. A diferencia del ecosistema cerrado de OpenAI, DeepSeek-R1 es de código abierto, de uso gratuito y radicalmente eficiente.

Christian Struve, cofundador y CEO de Fracttal, explica que: “DeepSeek no es el primer modelo de código abierto, pero su licencia MIT y su modelo de pensamiento R1 destacan por su precisión y bajo coste de entrenamiento, democratizando el acceso a IA avanzada, ya sea de forma local o a través de APIs accesibles, impulsando así la innovación.”

Si bien NVIDIA había subido los últimos años su cotización en bolsa y con ello su capitalización hasta convertirse en una de las compañías más valiosas del planeta. Los motivos eran conocidos. Las aceleradoras de NVIDIA para IA son las más requeridas y cotizadas del mercado. La cosa es que DeepSeek está demostrando que no se necesita una alta cantidad de hardware se puede conseguir lo mismo (o más) que los grandes modelos de lenguaje de IA, insaciables de recursos, tanto de procesamiento como energéticos.

Debido a esto, claramente el sector de la IA estaba inflado, tanto en la cantidad de inversión como en los supuestos “beneficios” para empresas y consumidores que en la realidad nadie ha comprobado. Simplemente, una startup china ha provocado un leve pinchazo de la burbuja y un revuelo que apenas comienza.  

La batalla no termina

Lo cierto es que DeepSeek movió la bolsa americana y al parecer no se detendrá. La firma china presentó recientemente última innovación: Janus-Pro-7B, un modelo de generación de imágenes con inteligencia artificial. 

Desde la startup aseguran que el Janus-Pro-7B supera a los modelos existentes como DALL-E y Stable Diffusion de OpenAI. En una decisión audaz que refleja su enfoque con anteriores desarrollos, la firma ha decidido que Janus-Pro-7B sea gratuito y de código abierto.

Para JD Raimondi, Jefe de Ciencia de Datos en Making Sense, los chinos se pisicionaron como buenos competidores al hacer un modelo más eficiente y a bajo costo: “DeepSeek tomó la iniciativa que Meta había tomado internamente: competir con los grandes modelos privados con modelos públicos que pueden ser utilizados por todos a bajo costo. Pero el diferenciador de DeepSeek con r1 es nuevo: además de ser gratuito, es eficiente, de bajo costo y con un rendimiento comparable al de los grandes (GPT o1, GPT o4)”.

“DeepSeek se posicionó muy fácilmente al mismo nivel que Meta como un buen competidor de los grandes para el modelo “ganador” (prevalente) en el mundo de las aplicaciones impulsadas por IA”, dijo JD Raimondi.

Al igual que DALL-E, los usuarios pueden ingresar el texto que describa una foto o una obra de arte, y el Janus-Pro de DeepSeek le proporcionará una imagen generada por IA. “Janus-Pro es un nuevo marco autorregresivo que unifica la comprensión y la generación multimodal”, afirmó la empresa china el lanzamiento del nuevo modelo.

DeepSeek se está posicionando como un formidable disruptor en la carrera de la IA. Y la burbuja está al borde del ser pinchada, como tantas otras en la industria de la tecnología.

Tags