1. Inicio
  2. / Inteligencia Artificial (IA)
  3. / Investigación revela que el costo del entrenamiento de IA de DeepSeek no es de 6 millones de dólares, sino un valor 216 veces MAYOR
Tiempo de lectura 3 min de lectura Comentarios 0 comentarios

Investigación revela que el costo del entrenamiento de IA de DeepSeek no es de 6 millones de dólares, sino un valor 216 veces MAYOR

Escrito por Fabio Lucas Carvalho
Publicado el 02/02/2025 a las 09:15
Actualizado el 02/02/2025 a las 09:17
DeepSeek
Foto: Reprodução
¡Sé la primera persona en reaccionar!
Reaccionar al artículo

Una nueva investigación reveló que el entrenamiento de la IA de DeepSeek no costó US$ 6 millones, sino un valor mucho más alto. ¡Descubre!

Un análisis reciente de SemiAnalysis reveló que el costo real de entrenamiento de la inteligencia artificial (IA) de DeepSeek es significativamente mayor de lo que se pensaba anteriormente.

Aunque estimaciones iniciales sugerían una inversión de aproximadamente US$ 6 millones, el informe indica que el valor real alcanza impresionantes US$ 1,3 mil millones.

Desenmascarando el mito de los US$ 6 millones

La estimación inicial de US$ 6 millones consideraba solo los gastos de pre-entrenamiento con GPUs, descuidando inversiones sustanciales en investigación y desarrollo, infraestructura y otros costos esenciales acumulados por la empresa.

El informe destaca que el gasto total de capital en servidores (CapEx) de DeepSeek llega a aproximadamente US$ 1,6 mil millones, con una parte considerable de ese valor destinada a la operación y mantenimiento de sus extensos clústeres de GPUs.

Infraestructura robusta e inversiones en hardware

DeepSeek tiene acceso a alrededor de 50.000 GPUs de la serie Hopper, incluyendo modelos como H800s, H100s y H20s, específicos para cada país, producidos por NVIDIA en respuesta a las restricciones de exportación de EE.UU.

Esta diversificación en el inventario de hardware refleja decisiones estratégicas de suministro y eficiencia operativa de la empresa.

Estructura organizacional y eficiencia operativa

A diferencia de algunos de los mayores laboratorios de IA, DeepSeek opera sus propios centros de datos y adopta un modelo simplificado que contribuye a su agilidad y eficiencia. Esta capacidad de adaptación rápida es vital en un escenario de IA cada vez más competitivo.

En términos de rendimiento, el modelo R1 de DeepSeek demuestra capacidades de razonamiento comparables al o1 de OpenAI.

No obstante, no se considera el líder indiscutible en todas las métricas de rendimiento. Aunque la estrategia de precios de DeepSeek ha recibido elogios, es importante señalar que el Gemini Flash 2.0 de Google, con capacidades similares, resulta aún más económico cuando se aplica a través de servicios de API.

Esto coloca a DeepSeek ante el desafío de equilibrar rendimiento y costo para asegurar su éxito futuro.

Una innovación notable destacada en el informe es la tecnología de Multi-Head Latent Attention (MLA), que reduce significativamente los costos de inferencia en un impresionante 93,3% mediante la reducción del uso de caché de clave-valor (KV). Este enfoque representa un gran avance hacia soluciones de IA más económicas.

Expertos sugieren que las innovaciones de DeepSeek probablemente serán rápidamente adoptadas por laboratorios occidentales de IA que buscan mantenerse competitivos.

El futuro de la IA china

Aunque hay optimismo sobre posibles mejoras y ganancias de eficiencia, el SemiAnalysis alerta sobre desafíos externos.

El informe especula que los costos operativos pueden caer aún más, impulsados por la capacidad de DeepSeek para adaptarse rápidamente en comparación con sus contrapartes más grandes y burocráticas.

No obstante, la ampliación de las operaciones en medio del aumento de los controles de exportación de EE.UU. representa un obstáculo significativo que DeepSeek debe superar con cautela.

Con información de SemiAnalysis.

Suscribir
Notificar de
guest
0 Comentarios
Más reciente
Más viejo Más votado
Comentario
Ver todos los comentarios
Etiquetas
Fabio Lucas Carvalho

Jornalista especializado em uma ampla variedade de temas, como carros, tecnologia, política, indústria naval, geopolítica, energia renovável e economia. Atuo desde 2015 com publicações de destaque em grandes portais de notícias. Minha formação em Gestão em Tecnologia da Informação pela Faculdade de Petrolina (Facape) agrega uma perspectiva técnica única às minhas análises e reportagens. Com mais de 10 mil artigos publicados em veículos de renome, busco sempre trazer informações detalhadas e percepções relevantes para o leitor.

Compartir en aplicaciones
0
Nos encantaría conocer tu opinión sobre este tema, ¡deja tu comentario!x