Investigación revela que el costo del entrenamiento de IA de DeepSeek no es de 6 millones de dólares, sino un valor 216 veces MAYOR

Escrito por Fabio Lucas Carvalho Publicado el 02/02/2025 a las 09:15 Actualizado el 02/02/2025 a las 09:17

Foto: Reprodução

¡Sé la primera persona en reaccionar!

Prefiere CPG en Google

Una nueva investigación reveló que el entrenamiento de la IA de DeepSeek no costó US$ 6 millones, sino un valor mucho más alto. ¡Descubre!

Un análisis reciente de SemiAnalysis reveló que el costo real de entrenamiento de la inteligencia artificial (IA) de DeepSeek es significativamente mayor de lo que se pensaba anteriormente.

Aunque estimaciones iniciales sugerían una inversión de aproximadamente US$ 6 millones, el informe indica que el valor real alcanza impresionantes US$ 1,3 mil millones.

Desenmascarando el mito de los US$ 6 millones

La estimación inicial de US$ 6 millones consideraba solo los gastos de pre-entrenamiento con GPUs, descuidando inversiones sustanciales en investigación y desarrollo, infraestructura y otros costos esenciales acumulados por la empresa.

EL ARTÍCULO CONTINÚA ABAJO

Vea también

El informe destaca que el gasto total de capital en servidores (CapEx) de DeepSeek llega a aproximadamente US$ 1,6 mil millones, con una parte considerable de ese valor destinada a la operación y mantenimiento de sus extensos clústeres de GPUs.

Infraestructura robusta e inversiones en hardware

DeepSeek tiene acceso a alrededor de 50.000 GPUs de la serie Hopper, incluyendo modelos como H800s, H100s y H20s, específicos para cada país, producidos por NVIDIA en respuesta a las restricciones de exportación de EE.UU.

Esta diversificación en el inventario de hardware refleja decisiones estratégicas de suministro y eficiencia operativa de la empresa.

Estructura organizacional y eficiencia operativa

A diferencia de algunos de los mayores laboratorios de IA, DeepSeek opera sus propios centros de datos y adopta un modelo simplificado que contribuye a su agilidad y eficiencia. Esta capacidad de adaptación rápida es vital en un escenario de IA cada vez más competitivo.

En términos de rendimiento, el modelo R1 de DeepSeek demuestra capacidades de razonamiento comparables al o1 de OpenAI.

No obstante, no se considera el líder indiscutible en todas las métricas de rendimiento. Aunque la estrategia de precios de DeepSeek ha recibido elogios, es importante señalar que el Gemini Flash 2.0 de Google, con capacidades similares, resulta aún más económico cuando se aplica a través de servicios de API.

Esto coloca a DeepSeek ante el desafío de equilibrar rendimiento y costo para asegurar su éxito futuro.

Una innovación notable destacada en el informe es la tecnología de Multi-Head Latent Attention (MLA), que reduce significativamente los costos de inferencia en un impresionante 93,3% mediante la reducción del uso de caché de clave-valor (KV). Este enfoque representa un gran avance hacia soluciones de IA más económicas.

Expertos sugieren que las innovaciones de DeepSeek probablemente serán rápidamente adoptadas por laboratorios occidentales de IA que buscan mantenerse competitivos.

El futuro de la IA china

Aunque hay optimismo sobre posibles mejoras y ganancias de eficiencia, el SemiAnalysis alerta sobre desafíos externos.

El informe especula que los costos operativos pueden caer aún más, impulsados por la capacidad de DeepSeek para adaptarse rápidamente en comparación con sus contrapartes más grandes y burocráticas.

No obstante, la ampliación de las operaciones en medio del aumento de los controles de exportación de EE.UU. representa un obstáculo significativo que DeepSeek debe superar con cautela.

Con información de SemiAnalysis.

0 Comentarios

Más reciente

Más viejo Más votado

Investigación revela que el costo del entrenamiento de IA de DeepSeek no es de 6 millones de dólares, sino un valor 216 veces MAYOR

Una nueva investigación reveló que el entrenamiento de la IA de DeepSeek no costó US$ 6 millones, sino un valor mucho más alto. ¡Descubre!

Desenmascarando el mito de los US$ 6 millones

Infraestructura robusta e inversiones en hardware

Estructura organizacional y eficiencia operativa

El futuro de la IA china

Más barato que HB20, Onix y Argo nuevos, este sedán alemán ofrece un maletero de 510 litros, motor 2.0 aspirado, transmisión automática Tiptronic de 6 velocidades y mecánica conocida; el Volkswagen Jetta Comfortline 2016 aún llama la atención en los usados.

El nuevo dron chino de 6 toneladas, el R6000, destaca por combinar características de avión y helicóptero, con capacidad para 12 personas y múltiples misiones.

El euro digital recibe luz verde del Parlamento Europeo, desafía el dominio de Visa y Mastercard y podría transformar cómo millones de personas en Europa gestionan sus pagos y finanzas para 2029.

Helicóptero lanza 180 toneladas de arena y grava sobre río en Suecia para restaurar lecho dañado por décadas de explotación y revitalizar hábitats acuáticos.

Un niño de 11 años salió de casa con dos primas para vender palomitas por R$ 5, se convirtió en empresario a los 15, vende 100 cubos por día y usa las ganancias para pagar a toda la familia que trabaja en el negocio.

Cansada de ver su salario desaparecer con la hipoteca, una joven de 24 años vende su casa de £125 mil, compra una furgoneta por £13 mil, invierte £6 mil, transforma el vehículo en un hogar y decide vivir por las carreteras de Europa.

Granja en el noreste de Brasil desafía la sequía: proyecto en el sertão de Sergipe utiliza ventilación constante, genética y almacenamiento de ensilaje para producir hasta 10,000 litros de leche diarios.

China construirá túnel submarino de 90 kilómetros para conectar dos ciudades actualmente unidas solo por ferry

Volunteers from NGO Teto build 18 m² home in two days, providing shelter from insects and cold for resident Daniele in a Brazilian community; 43 homes delivered in 2026 across Brazil

Nota aclaratoria y derecho de respuesta.

Alcalde en EE.UU. se disfraza de persona sin hogar durante una semana para comprender el aumento de la indigencia, generando debate en su ciudad.

Investigación revela que el costo del entrenamiento de IA de DeepSeek no es de 6 millones de dólares, sino un valor 216 veces MAYOR

Una nueva investigación reveló que el entrenamiento de la IA de DeepSeek no costó US$ 6 millones, sino un valor mucho más alto. ¡Descubre!

Desenmascarando el mito de los US$ 6 millones

Infraestructura robusta e inversiones en hardware

Estructura organizacional y eficiencia operativa

El futuro de la IA china

Más barato que HB20, Onix y Argo nuevos, este sedán alemán ofrece un maletero de 510 litros, motor 2.0 aspirado, transmisión automática Tiptronic de 6 velocidades y mecánica conocida; el Volkswagen Jetta Comfortline 2016 aún llama la atención en los usados.

El nuevo dron chino de 6 toneladas, el R6000, destaca por combinar características de avión y helicóptero, con capacidad para 12 personas y múltiples misiones.

El euro digital recibe luz verde del Parlamento Europeo, desafía el dominio de Visa y Mastercard y podría transformar cómo millones de personas en Europa gestionan sus pagos y finanzas para 2029.

Helicóptero lanza 180 toneladas de arena y grava sobre río en Suecia para restaurar lecho dañado por décadas de explotación y revitalizar hábitats acuáticos.

Un niño de 11 años salió de casa con dos primas para vender palomitas por R$ 5, se convirtió en empresario a los 15, vende 100 cubos por día y usa las ganancias para pagar a toda la familia que trabaja en el negocio.

Cansada de ver su salario desaparecer con la hipoteca, una joven de 24 años vende su casa de £125 mil, compra una furgoneta por £13 mil, invierte £6 mil, transforma el vehículo en un hogar y decide vivir por las carreteras de Europa.

El ‘tsunami’ de inversiones dirigidas a empresas de Inteligencia Artificial (IA) y de semiconductores, que priorizan la seguridad y ganancias más predecibles, ha sido determinante para la trayectoria descendente del Bitcoin.

Samsung mira fábrica estratégica de chips en Corea del Sur y puede mover el tablero global de la IA con avances en memorias HBM y empaquetado avanzado.

Nvidia cierra acuerdos en Corea del Sur para fábricas de IA y lleva centros de datos, chips avanzados y nube global a otro nivel hasta 2027.

ChatGPT revela qué trabajo humano elegiría si pudiera trabajar de verdad.

Granja en el noreste de Brasil desafía la sequía: proyecto en el sertão de Sergipe utiliza ventilación constante, genética y almacenamiento de ensilaje para producir hasta 10,000 litros de leche diarios.

China construirá túnel submarino de 90 kilómetros para conectar dos ciudades actualmente unidas solo por ferry

Volunteers from NGO Teto build 18 m² home in two days, providing shelter from insects and cold for resident Daniele in a Brazilian community; 43 homes delivered in 2026 across Brazil

Nota aclaratoria y derecho de respuesta.

Alcalde en EE.UU. se disfraza de persona sin hogar durante una semana para comprender el aumento de la indigencia, generando debate en su ciudad.