Estudio en Nature revela el costo real y estrategia tras DeepSeek-R1

En un esfuerzo por transparentar su tecnología y acallar especulaciones, DeepSeek participó en la publicación de un artículo revisado por pares en la revista Nature que detalla por primera vez los recursos empleados para entrenar su famoso modelo R1.

Según el estudio, divulgado el 17 de septiembre, la compañía china asegura haber gastado apenas 294 000 dólares en el entrenamiento completo de R1, una cifra extraordinariamente baja comparada con las decenas o cientos de millones que se estiman para modelos equivalentes en EE. UU.

(OpenAI nunca ha divulgado costos exactos, pero su CEO Sam Altman insinuó en 2023 que entrenar sus modelos fundacionales costaba “mucho más” de 100 millones de dólares).

DeepSeek atribuye este logro a sus métodos de optimización y al uso de hardware disponible en China: R1 habría sido entrenado usando 512 GPUs Nvidia H800 –chips de menor capacidad diseñados para el mercado chino tras las restricciones de exportación de EE. UU.– durante un total de 80 horas.

El artículo de Nature, firmado entre otros por el fundador de DeepSeek Liang Wenfeng, también aborda por primera vez una polémica surgida a inicios de año: la sospecha de que DeepSeek habría “destilado” modelos de OpenAI para crear R1.

Altos asesores de la Casa Blanca y figuras de la IA en EE. UU. habían lanzado acusaciones en enero sugiriendo que la empresa china reaprovechó conocimiento de sistemas como GPT-4 sin autorización.

En la documentación suplementaria de la publicación, el equipo de DeepSeek niega categóricamente estas imputaciones (aunque sin mencionarlas directamente), defendiendo la técnica de la destilación de modelos como una vía legítima para mejorar el rendimiento a bajo coste.

“La destilación –escriben los investigadores– produce mejor desempeño y abarata el entrenamiento y ejecución, ampliando el acceso a tecnologías de IA”.

Esta afirmación refuerza la postura que la empresa ya había mantenido ante la prensa: que sus avances provienen de innovaciones propias en algoritmos y enfoques de refuerzo, y no de atajos ilícitos.

El informe en Nature despeja algunas dudas pero también reconoce ciertos apoyos de hardware extranjeros en etapas preliminares.

Por ejemplo, DeepSeek admite por primera vez haber utilizado algunas GPU Nvidia A100 (chip vetado por EE. UU. para China) durante fases de experimentación y preparación antes del entrenamiento final con H800.

Si bien la compañía insiste en que el entrenamiento principal sí se hizo íntegramente con hardware permitido (H800 obtenidos lícitamente), la revelación matiza la narrativa de total independencia tecnológica.

Expertos citados por Reuters señalan que, aun siendo fidedignos los 294 000 dólares declarados para la carrera final de entrenamiento, ese monto es “solo la punta del iceberg” en el costo total de desarrollo de R1.

El proceso de investigación y prueba hasta llegar a la configuración óptima pudo requerir recursos mucho mayores –quizás centenas de millones de dólares en horas de cómputo y talento–, según estiman fuentes anónimas de laboratorios de IA en EE. UU.

Con todo, la publicación del estudio ha sido recibida como un hito para DeepSeek, al ser la primera vez que una revista científica de alto impacto documenta en detalle el funcionamiento interno de sus modelos.

Investigadores independientes valoran especialmente la claridad en torno a la filosofía de DeepSeek: lograr capacidades de punta con presupuestos modestos, desafiando el dogma de que solo con inversiones astronómicas se alcanzan los mejores resultados.

La comunidad científica destaca que, más allá de la cifra de entrenamiento, R1 introdujo un enfoque innovador basado en razonamiento paso a paso y refuerzo que ha influido en numerosos trabajos posteriores.

En conjunto, esta “radiografía” académica de R1 no solo legitima a DeepSeek ante círculos escépticos, sino que proporciona valiosas pistas técnicas para otros grupos que busquen replicar sus éxitos sin disponer de los recursos de un gigante tecnológico.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *