la inteligencia artificial china que supera a ChatGPT (y es gratuita)

¿Es posible construir una inteligencia artificial tan potente como la de los gigantes tecnológicos invirtiendo solo una fracción de sus recursos? DeepSeek, una start-up china casi desconocida hasta hace poco, ha demostrado que sí. Con un presupuesto de solo 6 millones de dólares y un enfoque innovador, ha desarrollado DeepSeek-V3, un modelo que no solo compite con ChatGPT y otros líderes del mercado, sino que también abre nuevas puertas al apostar por el código abierto. Pero, ¿cómo logró esta hazaña y por qué su historia está sacudiendo los cimientos de la carrera global por la IA?

Qué es DeepSeek y de dónde sale

DeepSeek es una empresa emergente china que, desde su fundación, se ha enfocado exclusivamente en la investigación de inteligencia artificial. A diferencia de gigantes como OpenAI, DeepSeek no ofrece productos para consumidores finales. Esto le permite operar con mayor libertad bajo las estrictas regulaciones chinas y centrar sus esfuerzos en el desarrollo de tecnología punta.

Su modelo más reciente, DeepSeek-V3, ha sorprendido a la comunidad tecnológica al demostrar un rendimiento comparable al de los mejores sistemas del mercado utilizando solo 2.000 chips de Nvidia. En comparación, empresas como OpenAI o Google suelen utilizar supercomputadoras con más de 16.000 chips para entrenar sus modelos. Este nivel de eficiencia es un logro técnico impresionante, más aún considerando las restricciones comerciales impuestas por Estados Unidos para limitar la venta de hardware avanzado a China.

Cómo acceder a DeepSeek

Para poder usarlo, es suficiente con acudir a la web de Deepseek y abrirse una cuenta para experimentar con él.

Además, DeepSeek ha desarrollado un modelo de razonamiento avanzado conocido como R1, diseñado para tareas como resolución de problemas matemáticos, programación y razonamiento lógico. Según pruebas independientes, R1 supera a ChatGPT en varios benchmarks especializados, como AIME, MATH-500 y SWE-bench Verified. Este enfoque en tareas más específicas no solo mejora la fiabilidad de sus respuestas, sino que también posiciona a DeepSeek como un actor clave en sectores altamente técnicos, como la ciencia y la tecnología.

La importancia del código abierto

Uno de los aspectos más revolucionarios de DeepSeek es su compromiso con el código abierto. Mientras que empresas como OpenAI han optado por mantener un modelo más cerrado y comercial, DeepSeek ha liberado el código de R1 bajo una licencia MIT. Esto significa que cualquier investigador o empresa puede usar, modificar y distribuir el modelo sin restricciones.

El impacto de esta decisión no debe subestimarse. A lo largo de la historia de la tecnología, el código abierto ha sido un motor de innovación y colaboración. Sistemas como Linux o herramientas como Python han transformado industrias completas al hacer que las tecnologías avanzadas sean accesibles para todos.

Además, la accesibilidad de DeepSeek no se limita al software. La empresa ha lanzado versiones “destiladas” de R1, que reducen el tamaño del modelo de 671.000 millones de parámetros a configuraciones que pueden ejecutarse incluso en ordenadores portátiles. Esto abre la puerta a que pequeños desarrolladores y empresas emergentes utilicen inteligencia artificial avanzada sin necesidad de invertir en hardware que salga de sus posibilidades.

¿En qué supera DeepSeek a ChatGPT?

Aunque ChatGPT sigue siendo una referencia en el mundo de la inteligencia artificial, DeepSeek ha logrado destacarse en varios aspectos clave:

Coste y eficiencia: DeepSeek-V3 fue entrenado con un presupuesto de solo 6 millones de dólares, una cifra muy inferior a los cientos de millones que OpenAI y otros han invertido en modelos comparables. Esto redefine la noción de que solo las grandes empresas tecnológicas pueden liderar el desarrollo de IA.

Especialización en razonamiento: R1 supera a ChatGPT en benchmarks como AIME (evaluación de razonamiento avanzado) y MATH-500 (problemas matemáticos), lo que lo convierte en una herramienta ideal para tareas complejas y técnicas.

Accesibilidad y flexibilidad: Mientras que los modelos de OpenAI suelen requerir infraestructura especializada, las versiones reducidas de R1 pueden ejecutarse en hardware básico, haciendo que su uso sea viable para una audiencia mucho más amplia.

Código abierto: A diferencia de OpenAI, DeepSeek comparte abiertamente su tecnología, lo que permite a otros investigadores y desarrolladores personalizar y mejorar el modelo según sus necesidades.

Sus limitaciones: la censura china

Sin embargo, DeepSeek también cuenta con limitaciones importantes, especialmente debido a las regulaciones chinas, que restringen el acceso del modelo a temas considerados políticamente sensibles. Por ejemplo, si le preguntas no responde sobre eventos históricos como la masacre de Tiananmen o debates sobre la autonomía de Taiwán.

El desarrollo de DeepSeek no puede entenderse sin considerar el entorno geopolítico en el que opera. Desde 2018, Estados Unidos ha impuesto restricciones comerciales para limitar el acceso de China a chips avanzados y otros componentes esenciales para entrenar modelos de IA. Estas medidas buscan mantener una ventaja competitiva en un sector que muchos consideran estratégico para la economía y la seguridad global.

No obstante, estas restricciones también han obligado a empresas como DeepSeek a buscar soluciones creativas. En lugar de depender de hardware de última generación, sus ingenieros han optimizado el uso de recursos disponibles, logrando entrenar modelos avanzados con menos chips y menores costes. Este enfoque no solo demuestra la capacidad de innovación de DeepSeek, sino que también plantea preguntas sobre la eficacia de las políticas comerciales restrictivas.

Lo que el impacto de DeepSeek puede implicar para el futuro de la IA

El éxito de DeepSeek tiene implicaciones que van más allá del ámbito tecnológico. Su modelo de bajo coste podría inspirar a otras empresas emergentes a buscar enfoques más sostenibles y creativos. En lugar de depender exclusivamente de inversiones multimillonarias, el futuro de la IA podría estar en la eficiencia, la colaboración y el acceso abierto.

Además, la apuesta de DeepSeek por el código abierto podría cambiar el equilibrio de poder en la carrera global por la inteligencia artificial. Si las mejores tecnologías abiertas provienen de China, es probable que muchos desarrolladores en todo el mundo construyan sus sistemas sobre estas bases. Esto podría posicionar a China como un líder en investigación y desarrollo de IA, desafiando la hegemonía de Estados Unidos en este campo.

No obstante, también surgen preocupaciones legítimas sobre el impacto de estas tecnologías. Al liberar herramientas avanzadas, se corre el riesgo de que sean utilizadas con fines poco positivos, como la propagación de desinformación o el desarrollo de armas autónomas.

En última instancia, el impacto de DeepSeek dependerá de cómo decidamos aprovechar sus innovaciones: ¿Será una herramienta para la colaboración global o una fuente de tensiones adicionales en un mundo ya dividido por la tecnología?