Una nueva investigación ha revelado que entrenar la IA de DeepSeek no costó 6 millones de dólares, sino mucho más. ¡Descubrir!
Un análisis reciente de la Semianálisis reveló que el costo real del entrenamiento de la inteligencia artificial (IA) de DeepSeek es significativamente más alto de lo que se pensaba anteriormente.
Aunque las estimaciones iniciales apuntaban a una inversión de aproximadamente $ 6 millones, el informe indica que el valor real alcanza cifras impresionantes US $ 1,3 mil millones.
Desacreditando el mito de los 6 millones de dólares
La estimación inicial de $ 6 millones consideró únicamente los gastos de preentrenamiento en GPU, descuidando inversiones sustanciales en investigación y desarrollo, infraestructura y otros costos esenciales acumulados por la empresa.
- ¡Universidad Federal lanza curso innovador y gratuito de inteligencia artificial, convirtiéndose en pionera en el país y abriendo nuevas oportunidades para los estudiantes!
- Los investigadores desarrollan una IA de predicción meteorológica que es mucho más rápida que los sistemas tradicionales y puede ejecutarse en una computadora estándar.
- Revolución en la educación: cursos gratuitos de inteligencia artificial que transforman carreras en Brasil
- Avances tecnológicos en salud: El papel de la inteligencia artificial, las terapias de ARN y la robótica en la evolución de los diagnósticos y tratamientos en 2025
El informe destaca que el gasto total de capital (CapEx) en servidores de DeepSeek asciende a aproximadamente 1,6 millones de dólares, y una parte considerable de ese monto se destina a la operación y el mantenimiento de sus extensos clústeres de GPU.
Inversiones robustas en infraestructura y hardware
DeepSeek tiene acceso a aproximadamente 50.000 GPU de la serie Hopper, incluidos modelos como los H800, H100 y H20 específicos de cada país producidos por NVIDIA en respuesta a las restricciones de exportación de EE. UU.
Esta diversificación en el inventario de hardware refleja las decisiones estratégicas de abastecimiento de la empresa y su eficiencia operativa.
Estructura organizacional y eficiencia operativa
A diferencia de algunos de los laboratorios de IA más grandes, DeepSeek opera sus propios centros de datos y adopta un modelo optimizado que contribuye a su agilidad y eficiencia. Esta capacidad de adaptarse rápidamente es vital en un panorama de IA cada vez más competitivo.
En términos de rendimiento, el modelo R1 de DeepSeek demuestra capacidades de razonamiento comparables al o1 de OpenAI.
Sin embargo, no se considera el líder indiscutible en todas las métricas de rendimiento. Si bien la estrategia de precios de DeepSeek ha recibido elogios, vale la pena señalar que Gemini Flash 2.0 de Google, con capacidades similares, demuestra ser aún más rentable cuando se accede a él a través de servicios API.
Esto presenta a DeepSeek el desafío de equilibrar el rendimiento y el costo para garantizar su éxito futuro.
Una innovación notable resaltada en el informe es la tecnología Multi-Head Latent Attention (MLA), que reduce significativamente los costos de inferencia en un impresionante 93,3 % a través del uso reducido de caché de valor clave (KV). Este enfoque representa un gran paso adelante hacia soluciones de IA más rentables.
Los expertos sugieren que es probable que las innovaciones de DeepSeek sean adoptadas rápidamente por los laboratorios de inteligencia artificial occidentales que buscan seguir siendo competitivos.
El futuro de la IA china
Aunque hay optimismo respecto de posibles mejoras y ganancias de eficiencia, SemiAnalysis advierte sobre desafíos externos.
El informe especula que los costos operativos podrían caer aún más, impulsados por la capacidad de DeepSeek de adaptarse rápidamente en comparación con sus contrapartes más grandes y burocráticas.
Sin embargo, ampliar las operaciones en medio de mayores controles de exportación por parte de Estados Unidos presenta un obstáculo importante que DeepSeek debe abordar con cautela.
Con información de Semianálisis.