El mayor chip del mundo no cabe en la punta de un dedo, tiene el tamaño de un plato de cena. La empresa estadounidense Cerebras hace exactamente lo opuesto al resto de la industria de semiconductores: en lugar de cortar el disco de silicio en cientos de chips pequeños, mantiene el wafer entero y transforma todo en un único procesador colosal, el Wafer Scale Engine, creado para entrenar inteligencia artificial.
¿Cómo puede ser un chip tan grande así? Porque Cerebras decidió no cortar el wafer, ese disco redondo de silicio de donde salen los chips. Mantener la oblea entera era considerado casi imposible debido a defectos de fabricación, pero la empresa encontró una manera de hacerlo funcionar, y el resultado es un procesador con una potencia que ningún chip tradicional alcanza.
El chip que ocupa un disco entero de silicio
El tamaño es el primer impacto. Según la IEEE Spectrum, el Wafer Scale Engine de tercera generación, el WSE-3, es cuadrado con 21,5 centímetros de lado y utiliza casi un wafer entero de 300 milímetros de silicio para formar un único chip, algo en torno a 46 mil milímetros cuadrados de área.
-
Científicos presentan la imagen más grande jamás capturada del centro de la Vía Láctea con 60 millones de estrellas, un logro histórico del telescopio Euclid que promete acelerar la búsqueda de nuevos planetas y desvelar grandes misterios del Universo.
-
Hawái transforma redes de pesca abandonadas y plástico doméstico en pavimento urbano para una carretera experimental en Oahu
-
¿El fin de los celulares? Mark Zuckerberg sorprende al mercado con gafas de IA, pantalla en la lente y pulsera neural que podrían reemplazar al smartphone
-
Astranis desarrolla satélites pequeños y económicos para llevar internet a Alaska, México y Filipinas.
La comparación con la competencia revela la diferencia. Según la IEEE Spectrum, los fabricantes tradicionales suelen limitarse a chips de un máximo de alrededor de 800 milímetros cuadrados, es decir, el mayor chip del mundo de Cerebras es decenas de veces más grande que un procesador común. Es como elegir entre servir un pastel en rebanadas o llevar el pastel entero a la mesa, y Cerebras llevó el pastel entero.
4 trillones de transistores en un solo pedazo

Los números del WSE-3 son impresionantes. Según Interesting Engineering, el chip reúne 4 billones de transistores y 900 mil núcleos optimizados para procesar inteligencia artificial, todo en un único bloque de silicio fabricado por TSMC en la tecnología de 5 nanómetros.
Guardar todo eso dentro de un solo chip trae un gran beneficio. Según IEEE Spectrum, el procesador aún incorpora 44 gigabytes de memoria en el propio chip, lo que evita el lento vaivén de datos que bloquea los sistemas comunes. Tener memoria y procesamiento en el mismo pedazo de silicio es lo que proporciona la velocidad extra, porque la información no necesita viajar fuera del chip en cada cálculo.
Por qué todo el mundo corta el wafer, menos Cerebras
La apuesta de Cerebras va en contra de décadas de práctica de la industria. Todo fabricante de chips parte del mismo wafer de silicio, un disco redondo, y lo corta en cientos de pedacitos, porque cuanto más pequeño es el chip, menor es la probabilidad de que un defecto microscópico arruine la pieza entera. Mantener el wafer entero siempre se ha visto como una receta para el desperdicio.
El truco fue diseñar el chip para convivir con fallas en lugar de evitarlas. Al crear caminos y núcleos de reserva que rodean cualquier defecto, la empresa logró mantener la oblea entera funcionando incluso si una parte de ella tiene problemas. Transformar al mayor enemigo de la fabricación, el defecto, en algo manejable fue el cambio de paradigma que hizo posible al gigante.
El chip más grande del mundo es 57 veces más grande que la mayor GPU de Nvidia

La referencia del mercado hoy son las GPUs, y es contra ellas que Cerebras mide su fuerza. Según Interesting Engineering, el WSE-3 es aproximadamente 57 veces más grande que la H200, la potente GPU de Nvidia utilizada para entrenar inteligencia artificial en todo el mundo.
Y el tamaño, aquí, se convierte en un rendimiento real. Según Interesting Engineering, el chip puede manejar un modelo con hasta 24 billones de parámetros en un único espacio de memoria, algo que requeriría juntar y sincronizar miles de GPUs. Según IEEE Spectrum, el WSE-3 aún duplica el rendimiento de la generación anterior consumiendo la misma energía. Hacer más gastando lo mismo es el santo grial en un sector donde la factura de luz de la IA no deja de subir.
Menos código y más velocidad para la IA
No es solo potencia bruta, también es facilidad. Según Interesting Engineering, ejecutar un modelo de lenguaje en el chip de Cerebras requiere aproximadamente un 97% menos de código que hacer lo mismo en una GPU, y un modelo del tamaño del GPT-3 cabía en solo 565 líneas de programación.
Esta simplicidad ahorra tiempo y dinero a los investigadores. Según Interesting Engineering, el sistema puede entrenar un modelo de 70 mil millones de parámetros en un solo día, una velocidad que cambia la rutina de quienes desarrollan inteligencia artificial. Reducir meses de trabajo a un día es el tipo de salto que decide quién llega primero en la carrera de los modelos de IA.
Quién usa el monstruo, de Mayo Clinic a G42
Un chip de este tamaño no es un juguete de laboratorio, ya tiene clientes de peso. Según Interesting Engineering, el superordenador CS-3, montado con estos chips, es utilizado por instituciones como el Argonne National Laboratory, la clínica estadounidense Mayo Clinic y la empresa G42, de los Emiratos Árabes.
Cada uno usa la potencia de una manera. Mayo Clinic aplica la inteligencia artificial en investigación médica, Argonne en ciencia avanzada, y G42 en modelos de lenguaje en árabe, mostrando que el apetito por procesamiento de IA cruza salud, ciencia e idioma. Cuando un hospital, un laboratorio nacional y un fondo multimillonario compiten por el mismo chip de IA, es señal de que el hambre por inteligencia artificial se ha vuelto global.
Quién está detrás de la apuesta
Al frente de Cerebras Systems, con sede en California, está Andrew Feldman, cofundador y director ejecutivo, quien apostó por una idea que muchos consideraban loca: hacer el chip más grande posible en lugar del más pequeño. La empresa ha estado mejorando el gigante en cada generación, desde el WSE-1 de 2019 hasta el actual WSE-3.
La trayectoria muestra persistencia en una tesis contra la corriente. Mientras el mundo entero perseguía chips cada vez más pequeños, Cerebras fue en la dirección opuesta y transformó el exceso en ventaja. Ir contra el consenso de la industria y demostrar que funciona es lo que separa una apuesta audaz de una extravagancia costosa, y por ahora Cerebras está del lado correcto de esa línea.
Lo que esta apuesta representa
El chip gigante de Cerebras es un recordatorio de que no siempre el camino de todos es el único que funciona. Al mantener el wafer entero, la empresa creó una herramienta especializada que ataca el mayor cuello de botella de la inteligencia artificial, que es la velocidad de entrenar modelos cada vez más grandes. No va a reemplazar la GPU en todo, pero muestra que hay más de una forma de resolver el problema más caro de la tecnología actual.
Y tú, ¿prefieres un futuro de la IA dominado por miles de chips pequeños trabajando juntos, o por pocos gigantes como el de Cerebras? Cuéntanos aquí en los comentarios cuál apuesta crees que es más prometedora.
