DeepSeek V4 llega con ventana de 1 millón de tokens, apunta a rivales de EE. UU. y promete agitar la carrera global de la inteligencia artificial

DeepSeek V4 amplía la disputa global por inteligencia artificial al combinar una ventana de contexto de 1 millón de tokens, mejoras en codificación, razonamiento y tareas orientadas por agentes, además de una estrategia enfocada en menores costos, hardware nacional y modelos de código abierto para presionar a los competidores de Estados Unidos.

DeepSeek presentó versiones de previsualización de su modelo de IA V4 y entró en una nueva etapa de la disputa global por inteligencia artificial, apuntando directamente a plataformas estadounidenses en un momento de aceleración del sector. La empresa china apuesta por una ventana de contexto de 1 millón de tokens, mejoras en codificación, razonamiento y tareas orientadas por agentes, además de una estrategia enfocada en la reducción de costos operativos.

El lanzamiento ocurre en una semana marcada por el avance de rivales de Estados Unidos y por acusaciones de la Casa Blanca contra China sobre la copia a gran escala de sistemas de IA americanos. En este escenario, DeepSeek busca ampliar su espacio con las series V4 Flash y V4 Pro, que llegan con actualizaciones arquitectónicas, mejoras de optimización y un enfoque declarado en la eficiencia.

DeepSeek apuesta por una ventana de contexto de 1 millón de tokens

Uno de los principales elementos del modelo V4 es la llamada Arquitectura de Atención Híbrida, presentada como una forma de mejorar la retención de contexto en conversaciones largas. La tecnología también busca reducir la pérdida de memoria en interacciones prolongadas, un punto relevante para usos más complejos de la inteligencia artificial.

EL ARTÍCULO CONTINÚA ABAJO

Vea también

DeepSeek también incorporó soporte para una ventana de contexto de 1 millón de tokens, lo que permite insertar bases de código completas o documentos extensos en un solo prompt. Esta capacidad puede alterar las rutinas de desarrollo de software y análisis empresarial, especialmente en tareas que dependen de grandes volúmenes de información.

Las series V4 Flash y V4 Pro fueron presentadas con un rendimiento sólido en pruebas comparativas que involucran sistemas de Anthropic, Google y OpenAI. La propia empresa reconoció, sin embargo, que la versión 4 aún está de tres a seis meses por detrás de los modelos más avanzados, aunque destaca su flexibilidad en costo e implementación.

La eficiencia se convierte en el eje central de la estrategia

DeepSeek mantiene la eficiencia como uno de los principales diferenciadores en la disputa con sus rivales de Estados Unidos. El sistema de billones de parámetros utiliza un enfoque de Mezcla de Expertos, que activa solo una fracción de los parámetros en cada tarea.

Este funcionamiento reduce los costos de inferencia en comparación con los modelos tradicionales, en los que todos los parámetros suelen activarse en cada solicitud. La elección técnica refuerza el intento de la empresa de competir en rendimiento sin depender de una estructura operativa tan cara.

La presión por la eficiencia cobra peso porque los sistemas de IA se están volviendo cada vez más caros de operar. DeepSeek intenta posicionarse como una alternativa en un mercado donde el rendimiento, el costo y la escala se han convertido en factores decisivos para empresas y desarrolladores.

Los chips chinos entran en el centro de la disputa

Los modelos de DeepSeek también fueron diseñados para funcionar con hardware nacional, lo que amplía la relevancia de la infraestructura china en el avance de la empresa. La expectativa es una nueva caída en los costos cuando los clústeres equipados con chips Ascend 950, de Huawei Technologies Co., entren en operación este año.

Este cambio puede reducir la dependencia de los fabricantes de chips de Estados Unidos y fortalecer la infraestructura de IA de China. La estrategia aparece en medio de la disputa por la capacidad computacional, considerada esencial para entrenar, operar y escalar modelos más avanzados.

La reacción de los mercados fue rápida después del anuncio. Las acciones de Semiconductor Manufacturing International Corp. y Hua Hong Semiconductor subieron, mientras que los papeles de empresas competidoras de IA retrocedieron.

El movimiento indica una apuesta de los inversores en el crecimiento de la demanda de chips fabricados en China. DeepSeek, sin embargo, afirmó que la capacidad de servicio de la serie V4 Pro sigue limitada por restricciones de recursos computacionales.

Negociaciones indican planes de expansión

La empresa también está en conversaciones con Tencent Holdings Ltd. y Alibaba Group Holding Ltd. para su primera ronda de financiación. Las negociaciones señalan planes de expansión de infraestructura, en un momento en que la capacidad computacional limita parte de la oferta del V4 Pro.

El lanzamiento de la versión V4 llega después del modelo R1, que agitó el mercado de la inteligencia artificial y provocó una reevaluación de las inversiones en sistemas de vanguardia. DeepSeek afirmó que el R1 ofrecía un rendimiento competitivo por una fracción del costo de los principales modelos estadounidenses.

Desde entonces, el debate sobre las inversiones ha vuelto a cobrar fuerza. Se prevé que las empresas de tecnología de Estados Unidos inviertan alrededor de 650 mil millones de dólares en 2026 en infraestructura de IA y centros de datos, intentando equilibrar las ganancias de rendimiento y los costos a largo plazo.

DeepSeek aumenta la presión sobre los modelos cerrados

DeepSeek afirma que la versión 4 profundiza la estrategia iniciada con el R1, con avances en escalabilidad y eficiencia. La empresa también continúa posicionando los modelos de código abierto como alternativas a los sistemas cerrados, atrayendo a desarrolladores y compañías que buscan más control sobre sus herramientas.

El lanzamiento, sin embargo, ocurre bajo escrutinio. Autoridades estadounidenses acusaron a DeepSeek de usar chips restringidos, mientras que Anthropic alegó uso indebido de su sistema Claude.

DeepSeek no divulgó los costos de entrenamiento ni los detalles de hardware de la versión 4. Aun así, el V4 refuerza la disputa en torno a costos menores, rendimiento escalable y flexibilidad de hardware, puntos que colocan a la empresa china en el centro de la próxima fase de la competencia global en inteligencia artificial.

Con información de Interesting Engineering

0 Comentarios

Más reciente

Más viejo Más votado

DeepSeek V4 llega con ventana de 1 millón de tokens, apunta a rivales de EE. UU. y promete agitar la carrera global de la inteligencia artificial

DeepSeek apuesta por una ventana de contexto de 1 millón de tokens

La eficiencia se convierte en el eje central de la estrategia

Los chips chinos entran en el centro de la disputa

Negociaciones indican planes de expansión

DeepSeek aumenta la presión sobre los modelos cerrados

Cueva congelada en el desierto de Nuevo México desafía el calor con una capa de hielo de hasta 6 metros de espesor

Ucrania convierte sus barcos robóticos Magura V7 en plataformas de drones: ahora lanzan FPVs y cohetes termobáricos desde el Mar Negro sin tripulación a bordo.

Cazadores de tormentas en Oklahoma miden vientos de 207 km/h y lanzan dron con sensores en el embudo de un tornado en una operación científica arriesgada.

China lanza el robot humanoide más parecido a un ser humano disponible para el público, con piel de silicona, 88 articulaciones y un precio inicial de aproximadamente 17.600 dólares.

SUV de Chevrolet más económico que un Kwid nuevo ofrece motor de Cruze con 153 CV, autonomía de hasta 620 km y paquete ADAS poco común en compactos

Seis esferas metálicas misteriosas encontradas en una playa de Queensland llevan a la Agencia Espacial Australiana a investigar posible origen en cohetes o satélites.

Brasil paga para controlar pez globo venenoso que amenaza ecosistemas y redes de pesca, con más de 103 toneladas capturadas hasta ahora.

Brasil financió metros y una siderúrgica en Venezuela a través del BNDES

Tailandia transforma 8 toneladas de botellas PET en 3,500 mochilas escolares, uniendo más de 40 fábricas en un ejemplo de economía circular.

Murciélagos misteriosos encontrados en las tumbas del Père Lachaise transforman el famoso cementerio de París en el «Cementerio de los Vampiros» para los turistas.

España lanza al mar la mayor plataforma flotante de cajones del mundo: un gigante de 56 metros fabrica seis estructuras de hormigón de 15,000 toneladas en el puerto de A Coruña con tecnología que ya ha dejado huella en Brasil.

De vender brochetas con su madre a dirigir una constructora que factura 300 millones de dólares y opera en el sector de petróleo y gas a los 30 años.

DeepSeek V4 llega con ventana de 1 millón de tokens, apunta a rivales de EE. UU. y promete agitar la carrera global de la inteligencia artificial

DeepSeek apuesta por una ventana de contexto de 1 millón de tokens

La eficiencia se convierte en el eje central de la estrategia

Los chips chinos entran en el centro de la disputa

Negociaciones indican planes de expansión

DeepSeek aumenta la presión sobre los modelos cerrados

Cueva congelada en el desierto de Nuevo México desafía el calor con una capa de hielo de hasta 6 metros de espesor

Ucrania convierte sus barcos robóticos Magura V7 en plataformas de drones: ahora lanzan FPVs y cohetes termobáricos desde el Mar Negro sin tripulación a bordo.

Cazadores de tormentas en Oklahoma miden vientos de 207 km/h y lanzan dron con sensores en el embudo de un tornado en una operación científica arriesgada.

China lanza el robot humanoide más parecido a un ser humano disponible para el público, con piel de silicona, 88 articulaciones y un precio inicial de aproximadamente 17.600 dólares.

SUV de Chevrolet más económico que un Kwid nuevo ofrece motor de Cruze con 153 CV, autonomía de hasta 620 km y paquete ADAS poco común en compactos

Seis esferas metálicas misteriosas encontradas en una playa de Queensland llevan a la Agencia Espacial Australiana a investigar posible origen en cohetes o satélites.

Brasil paga para controlar pez globo venenoso que amenaza ecosistemas y redes de pesca, con más de 103 toneladas capturadas hasta ahora.

Estudio revela que el 39% de 2,500 profesionales cree que la IA los hace menos inteligentes y el 41% teme un impacto negativo en sus carreras a largo plazo.

Panasonic ajusta estrategia en EE.UU., se enfoca en baterías para centros de datos de IA ante creciente demanda energética global impulsada por la inteligencia artificial

Emprendedor brasileño desarrolla dispositivo que conversa diariamente con personas mayores solitarias, monitorea su salud las 24 horas y alerta a familiares sobre posibles problemas de salud.

Inteligencia artificial desarrolla hamburguesas personalizadas y sorprende en prueba a ciegas con más de 100 participantes, igualando o superando la aceptación de cadenas de comida rápida.

La Inteligencia Artificial impulsa una nueva generación de negocios, permitiendo a pequeños grupos de emprendedores crear empresas más ágiles, validar ideas antes de grandes inversiones y escalar rápidamente en el ámbito del emprendimiento digital.

Brasil financió metros y una siderúrgica en Venezuela a través del BNDES

Tailandia transforma 8 toneladas de botellas PET en 3,500 mochilas escolares, uniendo más de 40 fábricas en un ejemplo de economía circular.

Murciélagos misteriosos encontrados en las tumbas del Père Lachaise transforman el famoso cementerio de París en el «Cementerio de los Vampiros» para los turistas.

España lanza al mar la mayor plataforma flotante de cajones del mundo: un gigante de 56 metros fabrica seis estructuras de hormigón de 15,000 toneladas en el puerto de A Coruña con tecnología que ya ha dejado huella en Brasil.

De vender brochetas con su madre a dirigir una constructora que factura 300 millones de dólares y opera en el sector de petróleo y gas a los 30 años.