1. Início
  2. / Inteligencia artificial (IA)
  3. / La investigación revela que el costo de entrenar la IA de DeepSeek no es de 6 millones de dólares, sino 216 veces MÁS ALTO
tiempo de leer 3 min de lectura Comentários 0 comentarios

La investigación revela que el costo de entrenar la IA de DeepSeek no es de 6 millones de dólares, sino 216 veces MÁS ALTO

Por Escrito Fabio Lucas Carvalho
Publicado em 02/02/2025 às 09:15
búsqueda profunda
Foto: Reproducción

Una nueva investigación ha revelado que entrenar la IA de DeepSeek no costó 6 millones de dólares, sino mucho más. ¡Descubrir!

Un análisis reciente de la Semianálisis reveló que el costo real del entrenamiento de la inteligencia artificial (IA) de DeepSeek es significativamente más alto de lo que se pensaba anteriormente.

Aunque las estimaciones iniciales apuntaban a una inversión de aproximadamente $ 6 millones, el informe indica que el valor real alcanza cifras impresionantes US $ 1,3 mil millones.

Desacreditando el mito de los 6 millones de dólares

La estimación inicial de $ 6 millones consideró únicamente los gastos de preentrenamiento en GPU, descuidando inversiones sustanciales en investigación y desarrollo, infraestructura y otros costos esenciales acumulados por la empresa.

El informe destaca que el gasto total de capital (CapEx) en servidores de DeepSeek asciende a aproximadamente 1,6 millones de dólares, y una parte considerable de ese monto se destina a la operación y el mantenimiento de sus extensos clústeres de GPU.

Inversiones robustas en infraestructura y hardware

DeepSeek tiene acceso a aproximadamente 50.000 GPU de la serie Hopper, incluidos modelos como los H800, H100 y H20 específicos de cada país producidos por NVIDIA en respuesta a las restricciones de exportación de EE. UU.

Esta diversificación en el inventario de hardware refleja las decisiones estratégicas de abastecimiento de la empresa y su eficiencia operativa.

Estructura organizacional y eficiencia operativa

A diferencia de algunos de los laboratorios de IA más grandes, DeepSeek opera sus propios centros de datos y adopta un modelo optimizado que contribuye a su agilidad y eficiencia. Esta capacidad de adaptarse rápidamente es vital en un panorama de IA cada vez más competitivo.

En términos de rendimiento, el modelo R1 de DeepSeek demuestra capacidades de razonamiento comparables al o1 de OpenAI.

Sin embargo, no se considera el líder indiscutible en todas las métricas de rendimiento. Si bien la estrategia de precios de DeepSeek ha recibido elogios, vale la pena señalar que Gemini Flash 2.0 de Google, con capacidades similares, demuestra ser aún más rentable cuando se accede a él a través de servicios API.

Esto presenta a DeepSeek el desafío de equilibrar el rendimiento y el costo para garantizar su éxito futuro.

Una innovación notable resaltada en el informe es la tecnología Multi-Head Latent Attention (MLA), que reduce significativamente los costos de inferencia en un impresionante 93,3 % a través del uso reducido de caché de valor clave (KV). Este enfoque representa un gran paso adelante hacia soluciones de IA más rentables.

Los expertos sugieren que es probable que las innovaciones de DeepSeek sean adoptadas rápidamente por los laboratorios de inteligencia artificial occidentales que buscan seguir siendo competitivos.

El futuro de la IA china

Aunque hay optimismo respecto de posibles mejoras y ganancias de eficiencia, SemiAnalysis advierte sobre desafíos externos.

El informe especula que los costos operativos podrían caer aún más, impulsados ​​por la capacidad de DeepSeek de adaptarse rápidamente en comparación con sus contrapartes más grandes y burocráticas.

Sin embargo, ampliar las operaciones en medio de mayores controles de exportación por parte de Estados Unidos presenta un obstáculo importante que DeepSeek debe abordar con cautela.

Con información de Semianálisis.

¡Sé el primero en reaccionar!
Reaccionar al artículo
¡Inscríbete!
notificar de
invitado
0 Comentários
Más viejo
Más reciente más votados
positivas
Ver todos los comentarios
Fabio Lucas Carvalho

Periodista especializado en una amplia variedad de temas, como automóviles, tecnología, política, industria naviera, geopolítica, energías renovables y economía. He estado trabajando desde 2015 con publicaciones destacadas en los principales portales de noticias. Mi formación en Gestión de Tecnologías de la Información por la Facultad de Petrolina (Facape) añade una perspectiva técnica única a mis análisis e informes. Con más de 10 mil artículos publicados en reconocidos medios de comunicación, siempre busco brindar información detallada y insights relevantes al lector. Para sugerencias de temas o cualquier pregunta, contáctenos por correo electrónico a flclucas@hotmail.com.

Compartir entre aplicaciones
0
Nos encantaría tu opinión sobre este tema, ¡comenta!x