Una nueva investigación reveló que el entrenamiento de la IA de DeepSeek no costó US$ 6 millones, sino un valor mucho más alto. ¡Descubre!
Un análisis reciente de SemiAnalysis reveló que el costo real de entrenamiento de la inteligencia artificial (IA) de DeepSeek es significativamente mayor de lo que se pensaba anteriormente.
Aunque estimaciones iniciales sugerían una inversión de aproximadamente US$ 6 millones, el informe indica que el valor real alcanza impresionantes US$ 1,3 mil millones.
Desenmascarando el mito de los US$ 6 millones
La estimación inicial de US$ 6 millones consideraba solo los gastos de pre-entrenamiento con GPUs, descuidando inversiones sustanciales en investigación y desarrollo, infraestructura y otros costos esenciales acumulados por la empresa.
-
Joven de 18 años transforma app creado en su habitación en una máquina millonaria de US$ 1,4 millones al mes con inteligencia artificial y estrategia visionaria
-
Niño de 5 años crea un juego completo con inteligencia artificial y revela cómo los niños están dominando la tecnología incluso antes de aprender programación tradicional
-
Para alimentar ChatGPT y los centros de datos del mundo en 2026, se necesitarán más de 1.000 TWh de electricidad — equivalente a todo el consumo de Japón.
-
Google compró 115 MW y seis bancos inyectaron US$ 421 millones: por qué los centros de datos de IA están eligiendo la energía geotérmica en lugar de la solar y la eólica
El informe destaca que el gasto total de capital en servidores (CapEx) de DeepSeek llega a aproximadamente US$ 1,6 mil millones, con una parte considerable de ese valor destinada a la operación y mantenimiento de sus extensos clústeres de GPUs.
Infraestructura robusta e inversiones en hardware
DeepSeek tiene acceso a alrededor de 50.000 GPUs de la serie Hopper, incluyendo modelos como H800s, H100s y H20s, específicos para cada país, producidos por NVIDIA en respuesta a las restricciones de exportación de EE.UU.
Esta diversificación en el inventario de hardware refleja decisiones estratégicas de suministro y eficiencia operativa de la empresa.
Estructura organizacional y eficiencia operativa
A diferencia de algunos de los mayores laboratorios de IA, DeepSeek opera sus propios centros de datos y adopta un modelo simplificado que contribuye a su agilidad y eficiencia. Esta capacidad de adaptación rápida es vital en un escenario de IA cada vez más competitivo.
En términos de rendimiento, el modelo R1 de DeepSeek demuestra capacidades de razonamiento comparables al o1 de OpenAI.
No obstante, no se considera el líder indiscutible en todas las métricas de rendimiento. Aunque la estrategia de precios de DeepSeek ha recibido elogios, es importante señalar que el Gemini Flash 2.0 de Google, con capacidades similares, resulta aún más económico cuando se aplica a través de servicios de API.
Esto coloca a DeepSeek ante el desafío de equilibrar rendimiento y costo para asegurar su éxito futuro.
Una innovación notable destacada en el informe es la tecnología de Multi-Head Latent Attention (MLA), que reduce significativamente los costos de inferencia en un impresionante 93,3% mediante la reducción del uso de caché de clave-valor (KV). Este enfoque representa un gran avance hacia soluciones de IA más económicas.
Expertos sugieren que las innovaciones de DeepSeek probablemente serán rápidamente adoptadas por laboratorios occidentales de IA que buscan mantenerse competitivos.
El futuro de la IA china
Aunque hay optimismo sobre posibles mejoras y ganancias de eficiencia, el SemiAnalysis alerta sobre desafíos externos.
El informe especula que los costos operativos pueden caer aún más, impulsados por la capacidad de DeepSeek para adaptarse rápidamente en comparación con sus contrapartes más grandes y burocráticas.
No obstante, la ampliación de las operaciones en medio del aumento de los controles de exportación de EE.UU. representa un obstáculo significativo que DeepSeek debe superar con cautela.
Con información de SemiAnalysis.

¡Sé la primera persona en reaccionar!