¡Revolución en IA! Empresa china crea tecnología que supera a ChatGPT con una inversión sorprendentemente baja
El reciente ascenso de China en el sector de inteligencia artificial (IA) está generando preocupación en Silicon Valley. EL búsqueda profunda, un laboratorio chino de inteligencia artificial hasta ahora desconocido, sorprendió al mundo al lanzar un modelo de lenguaje codificado, gratuito y de gran tamaño. abrir.
A pesar de haber sido construido con un presupuesto inferior al $ 6 millones y utilizando chips Nvidia H800s, de capacidad reducida, el modelo logró superar a fuertes competidores de Estados Unidos, como Meta Llama 3.1, GPT-4o de OpenAI y Claude Sonnet 3.5 de Anthropic. Este giro de los acontecimientos está poniendo en duda el liderazgo global de Estados Unidos en el sector.
El avance tecnológico de DeepSeek
En pruebas comparativas realizadas por terceros, el modelo DeepSeek destacó en varias áreas, como resolución de problemas complejos, matemáticas y codificación.
- La nueva súper herramienta de ChatGPT revela los principales empleos que podrían estar al borde del abismo
- Seagems revoluciona la ingeniería submarina con automatización e IA, reduciendo el tiempo hasta en un 95%
- Descargar DeepSeek podría ser un delito en EE.UU.: 20 años de cárcel y una multa de 100 millones de dólares
- La investigación revela que el costo de entrenar la IA de DeepSeek no es de 6 millones de dólares, sino 216 veces MÁS ALTO
Además, la compañía anunció recientemente r1, un modelo de razonamiento que también superó al modelo o1 de OpenAI en varias de estas pruebas.
"Ver el nuevo modelo de DeepSeek es súper impresionante en términos de cómo realmente hicieron que un modelo de código abierto fuera eficiente en términos de cálculo del tiempo de inferencia.“, afirmó Satya Nadella, director ejecutivo de Microsoft, durante el Foro Económico Mundial en Davos.
Desafíos y soluciones chinos ante las restricciones estadounidenses
A búsqueda profunda se ha enfrentado a importantes desafíos debido a las estrictas restricciones a los semiconductores impuestas por Estados Unidos, que han impedido que China acceda a chips más potentes como H100s de Nvidia.
Sin embargo, los avances de la empresa sugieren que ha encontrado formas creativas de sortear estas barreras, posiblemente a través de técnicas como la destilación de modelos.
Este proceso permite que un modelo más pequeño aprenda de un modelo más grande, reduciendo costos y optimizando la eficiencia computacional.
"Pueden tomar un modelo grande y realmente bueno y utilizar un proceso llamado destilación para entrenar un modelo más pequeño, haciéndolo más inteligente y de manera muy rentable.“, explicó Chetan Puttagunta, socio de Benchmark.
El papel del fondo de cobertura y el misterio que rodea a DeepSeek
Se sabe poco sobre la estructura interna de búsqueda profunda y su fundador, Liang WenFeng. La empresa surgió del fondo de cobertura. Cantidad de alto vuelo, que gestiona aproximadamente US $ 8 mil millones en activos.
La falta de transparencia de la empresa ha generado especulaciones sobre su verdadero potencial y planes de futuro.
Otras iniciativas chinas en IA
A búsqueda profunda No es la única empresa china que está ganando terreno en la escena mundial de la IA.
La startup 01.ai, fundada por el renombrado investigador Kai-Fu Lee, logró entrenar un modelo de IA con sólo 3 millones de dólares.
Además, ByteDance, la empresa matriz de TikTok, anunció recientemente una actualización de su modelo de IA, que también superó al o1 de OpenAI en puntos de referencia clave.
"La necesidad es la madre de la invención.“, dijo Aravind Srinivas, director ejecutivo de Perplexity. "Como tuvieron que encontrar soluciones alternativas, terminaron construyendo algo mucho más eficiente".
Impactos para el futuro de la IA global
El rápido avance de China em IA plantea dudas sobre la sostenibilidad de las inversiones masivas de los gigantes estadounidenses en infraestructura y modelos de inteligencia artificial.
Si las empresas chinas pueden desarrollar modelos competitivos con menos recursos y hardware menos avanzado, las empresas occidentales necesitarán reconsiderar sus estrategias para mantener el liderazgo.
Para Estados Unidos, este escenario representa una advertencia sobre la necesidad de revisar sus políticas de restricción de exportaciones de tecnología.
Además, la eficiencia de las soluciones chinas podría conducir a una redefinición de las prioridades de investigación y desarrollo en Occidente.
El surgimiento de DeepSeek como una amenaza al dominio estadounidense en IA es un recordatorio del dinamismo de este sector.
La capacidad de China para desarrollar modelos de alto rendimiento con presupuestos ajustados desafía las suposiciones existentes sobre los requisitos de inversión y hardware necesarios para lograr avances significativos.
Debido a esto, las empresas y los gobiernos deben monitorear de cerca los avances de China y buscar soluciones innovadoras para mantener la competitividad en el mercado global de la IA. La próxima década promete ser decisiva para determinar quién liderará esta revolución tecnológica.