1. Inicio
  2. / Inteligencia Artificial (IA)
  3. / DeepSeek V4 llega con ventana de 1 millón de tokens, apunta a rivales de EE. UU. y promete agitar la carrera global de la inteligencia artificial
Tiempo de lectura 5 min de lectura Comentarios 0 comentarios

DeepSeek V4 llega con ventana de 1 millón de tokens, apunta a rivales de EE. UU. y promete agitar la carrera global de la inteligencia artificial

Escrito por Fabio Lucas Carvalho
Publicado el 24/04/2026 a las 23:59
¡Sé la primera persona en reaccionar!
Reaccionar al artículo

DeepSeek V4 amplía la disputa global por inteligencia artificial al combinar una ventana de contexto de 1 millón de tokens, mejoras en codificación, razonamiento y tareas orientadas por agentes, además de una estrategia enfocada en menores costos, hardware nacional y modelos de código abierto para presionar a los competidores de Estados Unidos.

DeepSeek presentó versiones de previsualización de su modelo de IA V4 y entró en una nueva etapa de la disputa global por inteligencia artificial, apuntando directamente a plataformas estadounidenses en un momento de aceleración del sector. La empresa china apuesta por una ventana de contexto de 1 millón de tokens, mejoras en codificación, razonamiento y tareas orientadas por agentes, además de una estrategia enfocada en la reducción de costos operativos.

El lanzamiento ocurre en una semana marcada por el avance de rivales de Estados Unidos y por acusaciones de la Casa Blanca contra China sobre la copia a gran escala de sistemas de IA americanos. En este escenario, DeepSeek busca ampliar su espacio con las series V4 Flash y V4 Pro, que llegan con actualizaciones arquitectónicas, mejoras de optimización y un enfoque declarado en la eficiencia.

DeepSeek apuesta por una ventana de contexto de 1 millón de tokens

Uno de los principales elementos del modelo V4 es la llamada Arquitectura de Atención Híbrida, presentada como una forma de mejorar la retención de contexto en conversaciones largas. La tecnología también busca reducir la pérdida de memoria en interacciones prolongadas, un punto relevante para usos más complejos de la inteligencia artificial.

DeepSeek también incorporó soporte para una ventana de contexto de 1 millón de tokens, lo que permite insertar bases de código completas o documentos extensos en un solo prompt. Esta capacidad puede alterar las rutinas de desarrollo de software y análisis empresarial, especialmente en tareas que dependen de grandes volúmenes de información.

Las series V4 Flash y V4 Pro fueron presentadas con un rendimiento sólido en pruebas comparativas que involucran sistemas de Anthropic, Google y OpenAI. La propia empresa reconoció, sin embargo, que la versión 4 aún está de tres a seis meses por detrás de los modelos más avanzados, aunque destaca su flexibilidad en costo e implementación.

La eficiencia se convierte en el eje central de la estrategia

DeepSeek mantiene la eficiencia como uno de los principales diferenciadores en la disputa con sus rivales de Estados Unidos. El sistema de billones de parámetros utiliza un enfoque de Mezcla de Expertos, que activa solo una fracción de los parámetros en cada tarea.

Este funcionamiento reduce los costos de inferencia en comparación con los modelos tradicionales, en los que todos los parámetros suelen activarse en cada solicitud. La elección técnica refuerza el intento de la empresa de competir en rendimiento sin depender de una estructura operativa tan cara.

La presión por la eficiencia cobra peso porque los sistemas de IA se están volviendo cada vez más caros de operar. DeepSeek intenta posicionarse como una alternativa en un mercado donde el rendimiento, el costo y la escala se han convertido en factores decisivos para empresas y desarrolladores.

Los chips chinos entran en el centro de la disputa

Los modelos de DeepSeek también fueron diseñados para funcionar con hardware nacional, lo que amplía la relevancia de la infraestructura china en el avance de la empresa. La expectativa es una nueva caída en los costos cuando los clústeres equipados con chips Ascend 950, de Huawei Technologies Co., entren en operación este año.

Este cambio puede reducir la dependencia de los fabricantes de chips de Estados Unidos y fortalecer la infraestructura de IA de China. La estrategia aparece en medio de la disputa por la capacidad computacional, considerada esencial para entrenar, operar y escalar modelos más avanzados.

La reacción de los mercados fue rápida después del anuncio. Las acciones de Semiconductor Manufacturing International Corp. y Hua Hong Semiconductor subieron, mientras que los papeles de empresas competidoras de IA retrocedieron.

El movimiento indica una apuesta de los inversores en el crecimiento de la demanda de chips fabricados en China. DeepSeek, sin embargo, afirmó que la capacidad de servicio de la serie V4 Pro sigue limitada por restricciones de recursos computacionales.

Negociaciones indican planes de expansión

La empresa también está en conversaciones con Tencent Holdings Ltd. y Alibaba Group Holding Ltd. para su primera ronda de financiación. Las negociaciones señalan planes de expansión de infraestructura, en un momento en que la capacidad computacional limita parte de la oferta del V4 Pro.

El lanzamiento de la versión V4 llega después del modelo R1, que agitó el mercado de la inteligencia artificial y provocó una reevaluación de las inversiones en sistemas de vanguardia. DeepSeek afirmó que el R1 ofrecía un rendimiento competitivo por una fracción del costo de los principales modelos estadounidenses.

Desde entonces, el debate sobre las inversiones ha vuelto a cobrar fuerza. Se prevé que las empresas de tecnología de Estados Unidos inviertan alrededor de 650 mil millones de dólares en 2026 en infraestructura de IA y centros de datos, intentando equilibrar las ganancias de rendimiento y los costos a largo plazo.

DeepSeek aumenta la presión sobre los modelos cerrados

DeepSeek afirma que la versión 4 profundiza la estrategia iniciada con el R1, con avances en escalabilidad y eficiencia. La empresa también continúa posicionando los modelos de código abierto como alternativas a los sistemas cerrados, atrayendo a desarrolladores y compañías que buscan más control sobre sus herramientas.

El lanzamiento, sin embargo, ocurre bajo escrutinio. Autoridades estadounidenses acusaron a DeepSeek de usar chips restringidos, mientras que Anthropic alegó uso indebido de su sistema Claude.

DeepSeek no divulgó los costos de entrenamiento ni los detalles de hardware de la versión 4. Aun así, el V4 refuerza la disputa en torno a costos menores, rendimiento escalable y flexibilidad de hardware, puntos que colocan a la empresa china en el centro de la próxima fase de la competencia global en inteligencia artificial.

Con información de Interesting Engineering

Suscribir
Notificar de
guest
0 Comentarios
Más reciente
Más viejo Más votado
Comentario
Ver todos los comentarios
Fabio Lucas Carvalho

Jornalista especializado em uma ampla variedade de temas, como carros, tecnologia, política, indústria naval, geopolítica, energia renovável e economia. Atuo desde 2015 com publicações de destaque em grandes portais de notícias. Minha formação em Gestão em Tecnologia da Informação pela Faculdade de Petrolina (Facape) agrega uma perspectiva técnica única às minhas análises e reportagens. Com mais de 10 mil artigos publicados em veículos de renome, busco sempre trazer informações detalhadas e percepções relevantes para o leitor.

Compartir en aplicaciones
0
Nos encantaría conocer tu opinión sobre este tema, ¡deja tu comentario!x