Una nueva investigación reveló que el entrenamiento de la IA de DeepSeek no costó US$ 6 millones, sino un valor mucho más alto. ¡Descubre!
Un análisis reciente de SemiAnalysis reveló que el costo real de entrenamiento de la inteligencia artificial (IA) de DeepSeek es significativamente mayor de lo que se pensaba anteriormente.
Aunque estimaciones iniciales sugerían una inversión de aproximadamente US$ 6 millones, el informe indica que el valor real alcanza impresionantes US$ 1,3 mil millones.
Desenmascarando el mito de los US$ 6 millones
La estimación inicial de US$ 6 millones consideraba solo los gastos de pre-entrenamiento con GPUs, descuidando inversiones sustanciales en investigación y desarrollo, infraestructura y otros costos esenciales acumulados por la empresa.
-
La empresa noruega 1X abrió en California la primera fábrica de robots humanoides verticalmente integrada de EE. UU. mientras que China en Guangdong produce 10 mil unidades por año.
-
La industria multimillonaria creada por la inteligencia artificial ya permite conversar por video con parientes muertos usando avatares digitales que recrean voz, rostro y memoria en una nueva frontera de la tecnología.
-
La inteligencia artificial china que resolvió sola en 80 horas un problema matemático abierto hace 12 años por el estadounidense Dan Anderson — y probó su propio resultado
-
Inteligencia artificial para robots con manos inspiradas en humanos avanza y amplía la capacidad de aprendizaje automático en la nueva generación de la robótica.
El informe destaca que el gasto total de capital en servidores (CapEx) de DeepSeek llega a aproximadamente US$ 1,6 mil millones, con una parte considerable de ese valor destinada a la operación y mantenimiento de sus extensos clústeres de GPUs.
Infraestructura robusta e inversiones en hardware
DeepSeek tiene acceso a alrededor de 50.000 GPUs de la serie Hopper, incluyendo modelos como H800s, H100s y H20s, específicos para cada país, producidos por NVIDIA en respuesta a las restricciones de exportación de EE.UU.
Esta diversificación en el inventario de hardware refleja decisiones estratégicas de suministro y eficiencia operativa de la empresa.
Estructura organizacional y eficiencia operativa
A diferencia de algunos de los mayores laboratorios de IA, DeepSeek opera sus propios centros de datos y adopta un modelo simplificado que contribuye a su agilidad y eficiencia. Esta capacidad de adaptación rápida es vital en un escenario de IA cada vez más competitivo.
En términos de rendimiento, el modelo R1 de DeepSeek demuestra capacidades de razonamiento comparables al o1 de OpenAI.
No obstante, no se considera el líder indiscutible en todas las métricas de rendimiento. Aunque la estrategia de precios de DeepSeek ha recibido elogios, es importante señalar que el Gemini Flash 2.0 de Google, con capacidades similares, resulta aún más económico cuando se aplica a través de servicios de API.
Esto coloca a DeepSeek ante el desafío de equilibrar rendimiento y costo para asegurar su éxito futuro.
Una innovación notable destacada en el informe es la tecnología de Multi-Head Latent Attention (MLA), que reduce significativamente los costos de inferencia en un impresionante 93,3% mediante la reducción del uso de caché de clave-valor (KV). Este enfoque representa un gran avance hacia soluciones de IA más económicas.
Expertos sugieren que las innovaciones de DeepSeek probablemente serán rápidamente adoptadas por laboratorios occidentales de IA que buscan mantenerse competitivos.
El futuro de la IA china
Aunque hay optimismo sobre posibles mejoras y ganancias de eficiencia, el SemiAnalysis alerta sobre desafíos externos.
El informe especula que los costos operativos pueden caer aún más, impulsados por la capacidad de DeepSeek para adaptarse rápidamente en comparación con sus contrapartes más grandes y burocráticas.
No obstante, la ampliación de las operaciones en medio del aumento de los controles de exportación de EE.UU. representa un obstáculo significativo que DeepSeek debe superar con cautela.
Con información de SemiAnalysis.

¡Sé la primera persona en reaccionar!