Para contar esta historia tenemos que empezar desde el principio, y no me refiero al principio cuando AMD en 2006, tras comprobar ATI Technologies, estuvo a punto de sobrepasar a Intel en la famosa guerra de procesadores. Empieza en 2017 con un rediseño de la arquitectura de los procesadores de AMD (bautizada como Zen) y una mejora de los procesos de fabricación que haría que la carrera de prestaciones parase momentáneamente para AMD, para pasar a ser una carrera de precio.
En pleno 2020 todo se basa en la nube. Eso quiere decir que todas las compañías, desde grandes compañías como Google, Amazon o Facebook hasta compañías más pequeñas necesitan procesar una gran cantidad de datos; y llevan mucho tiempo pidiendo procesadores con más potencia, y sobre todo, que aumente el número de núcleos.
Imaginaros que tienes que montar un centro de datos con 1024 núcleos. Si lo único que tienes son procesadores de cuatro núcleos, vas a necesitar muchísimos procesadores y junto a ellos muchísimas placas base. Aunque desarrolles placas base capaces de soportar dos procesadores, o incluso cuatro, o hasta ocho; vas a necesitar muchísimas placas base y esto es un problema.
Primero por los costes, además de pagar 256 procesadores vas a tener que comprar cientos de placas base, después interconectar todos estos procesadores sin placas base es complicado. Especialmente te van a dar muchos dolores de cabeza las latencias. Al tener tantos procesadores la comunicación entre muchos de ellos va a ser muy lenta y eso va a hacer que tu centro de datos pierda mucha eficiencia y no obtengas el rendimiento que esperarías obtener. Por último el consumo porque cada placa base tiene su chipset además de otros componentes... cada uno de los procesadores también tiene mucho más hardware además de los núcleos. Cada uno tiene su controlador de memoria, su controlador PCI Express... hay muchísimo hardware duplicado que consumirá energía y en un gran centro de datos con miles de procesadores supone muchísimo dinero. Todo sería mucho más sencillo si en vez de necesitar 256 procesadores de cuatro núcleos, pudiéramos montar tan sólo 15 procesadores de 64 núcleos.
Tendríamos mucho mejor rendimiento, tendríamos mayor facilidad para interconectar todos los procesadores, el consumo sería mucho menor, el centro de datos ocuparía muchísimo menos espacio, se generaría menos calor (así que ahorraríamos también el aire acondicionado)... serían todo ventajas.
Por ello se inició la llamada "Guerra de los núcleos" donde AMD e Intel compiten por crear los procesadores más potentes y con mayor número de núcleos posibles.
💡 Para poner en contexto lo que vas a seguir leyendo AMD es un empresa mucho más pequeña que Intel, siendo alrededor de una décima parte AMD frente a lo que es Intel a nivel de empresa en aspectos como número de empleados, facturación, valoración de empresa... según datos obtenidos de Forbes.
El fallo de Intel
Intel se desmarcó en 2008 de AMD gracias a sus procesadores que incluían una arquitectura RingBus con la micro-arquitectura Nehalem, para luego en 2016 hacer una apuesta por una arquitectura Mesh con la micro-arquitectura Skylake.
Mientras que RingBush funciona bien para un número no demasiado alto de núcleos, el diseño hacía aguas en la latencia (tiempo en forma de retraso) entre núcleos para su comunicación. Según se aumentaba el número de anillos, o núcleos en los anillos, el incremento de la latencia es lineal. De manera general la latencia máxima en una arquitectura de este tipo es el número de núcleos entre 2.
En el caso de una arquitectura Mesh, además de existir múltiples caminos para ir de un núcleo a otros núcleos, existen más interconexiones que en el modelo RingBush que nos permite evitar congestiones (cuellos de botella) al existir caminos alternativos. El incrementos de núcleos no supone un incremento lineal de la latencia, presentando de manera general una latencia máxima en la arquitectura que es la suma de los lados de la malla menos uno.
Intel encontró la forma de crear procesadores con un gran número de núcleos y un rendimiento óptimo. Sin embargo probablemente debido a que empezaron a desarrollar este tipo de tecnología ( basada en una micro-arquitectura Mesh) desde hace al menos hace una década, Intel cometió un error fatal.
Hasta ahora hemos hablado solo de arquitecturas, sin embargo estos procesadores hay que fabricarlos. ¿Cómo se fabrican? - en obleas.
Una oblea es un círculo de silicio donde unas máquinas literalmente dibujan los procesadores en un proceso llamado fotolitografía. Por cada oblea se pueden crear decenas o incluso cientos de chips, dependiendo del tamaño de los chips. Bien, ¿qué pasa si metemos más núcleos al procesador? Éste se va a hacer más grande y ocupa más espacio, por lo tanto si el procesador es más grande puedes introducir menos procesadores por oblea.
Pero además hay otro problema y es que los transistores que forman los condensadores modernos son muy pequeños y son muy difíciles de imprimir haciendo que sea normal que ciertas zonas de la oblea salgan defectuosas.
Pongamos un ejemplo extremo, imaginemos una oblea con decenas de procesadores pequeñitos y que parte de la oblea sale mal. No hay problema, perderás algunos procesadores pero se sigue consiguiendo decenas de ellos correctos. Sin embargo si estamos produciendo procesadores muy grandes, ese mismo defecto podría cargarse tranquilamente la mitad de los procesadores de la oblea. Por lo tanto cuanto más grande sea el procesador, menos puedes producir. Así que si metes más núcleos, haces tu procesador más grande y por lo tanto puedes producir menos. En vez de producir miles por ahora, sólo puedes producir unos poquitos. Además el coste de fabricación es mucho más alto, haciendo el procesador más caro. Y no sólo eso, la dificultad para imprimir chips tan grandes, también hará que tengas que gastar mucho dinero y tiempo en poner a punto las máquinas que los fabrican, aumentando aún más el precio del procesador.
Entonces aunque Intel tenga una arquitectura que en teoría permite crear procesadores con un número de núcleos muy alto, tenemos un problema. Fabricar esos procesadores es muy complicado... pero bueno, no hay que preocuparse. Por esto porque existe la ley de Moore que dice que cada dos años se duplica el número de transistores en un microprocesador. Desde los años 70 el avance en el mundo la tecnología se ha regido por esta ley, así que no hay de qué preocuparse. Si este año puedo fabricar un procesador de 8 núcleos en 2 años en el mismo espacio, gracias a la mejora en procesos de fabricación, me entran 16, y en otros 2 años me entran 32, y en otros 2 años 64, y luego 128, y luego 256...
Fabricar los chips no es un problema porque cada año los procesos de fabricación mejoran y los transistores que forman el procesador se pueden imprimir más pequeñitos... y este es el error que cometió Intel.
La mal llamada ley de Moore, que es más bien una observación que una ley, no tiene en cuenta que el silicio tiene un límite donde no podemos hacer los transistores más pequeños porque los electrones se salen de los circuitos y estamos muy cerca de ese límite. Por lo tanto el avance en procesos de fabricación se ha ralentizado.
El número de transistores en un procesador ya no se duplica cada dos años, de hecho la propia Intel lleva cuatro años atascada en el mismo proceso de fabricación de los 14 nanómetros y van a seguir atascados en él al menos un año más hablando de chips de alto rendimiento. ¿Qué quiere decir esto? Que durante al menos cinco años no han podido aumentar el número de transistores que caben en el mismo espacio y se espera que el avance se ralentice todavía más en los próximos años. Así que eso de que en dos años te van a caber el doble de núcleos en el mismo espacio era cierto hace unos años, pero a día de hoy no lo es, pero bueno... tampoco entremos en pánico porque con procesadores de cuatro núcleos para la gama doméstica y de hasta 10 para las gamas de rendimiento y servidores, salvo alguna excepción de algún procesador que te dé más núcleos, pero fabricamos muy poquitos no hay problema. Son pequeños se venden bien, no hay competencia y el dinero no hace más que entrar, todo controlado 😏. Seguimos así y ya cuando podamos, pues ya meteremos más núcleos, no tenemos ninguna prisa, no hay nada de lo que preocuparse... o sí... 🤔 La tormenta perfecta que hará temblar los cimientos de Intel comienza a formarse.
El primer golpe de efecto de AMD
En el 2017 AMD resurge de sus cenizas con su nueva arquitectura Zen y planta procesadores de ocho núcleos en la gama doméstica y hasta 32 núcleos en la gama de alto rendimiento y servidores. Intel evidentemente para seguir en el liderato de potencia se ve obligada a responder. Pasa de procesadores de 4 a 8 núcleos en la gama doméstica y el número de núcleos en sus procesadores de alto rendimiento y servidores aumenta hasta 28. Sin embargo durante esta transición el proceso de fabricación se mantiene. Los procesadores siguen fabricándose a 14 nanómetros, esto quiere decir que están fabricando procesadores el doble de grandes, lo cual supone que su producción se reduce a la mitad. Si antes fabricaban 1000 procesadores, pasan a fabricar la mitad, 500. Esto por sí solo ya es un duro golpe para Intel, pero ese golpe llega en el peor momento posible.
Intel se encuentra en medio de la transición de su proceso de fabricación de 14 nanómetros al nuevo proceso de fabricación a 10 nanómetros. Eso quiere decir que algunas de sus líneas de producción a 14 nanómetros se cierran para adaptarlas al nuevo proceso de fabricación como en transiciones anteriores. Se esperaba una transición rápida y sin problemas, al final cabo las fábricas de Intel han sido líderes en eso durante décadas. Son los mejores en esto, pero no esta vez Intel falla. Los 10 nanómetros no funcionan y la producción del nuevo proceso de fabricación no puede comenzar. Se retrasa primero un año, luego dos, luego tres... el proceso de fabricación que estaba inicialmente previsto para 2016 pasa a no estar previsto hasta 2020 2021.
Intel colapsa con su producción diezmada por tener que producir chips más grandes para competir con AMD, y encima con sus fábricas sin poder trabajar a su máxima capacidad. No son capaces de producir chips suficientes, sus procesadores en cuestión de semanas duplican su precio,
Procesadores que antes estaban en ciento y pico euros, pasan a costar 300 euros. Parte de su gama de procesadores, como los de bajo consumo para tablet, pasan directamente a no estar disponibles porque Intel no tiene capacidad para fabricarlos. Intel intenta buscar ayuda exterior de otras fábricas como las de Samsung o TSMC para que fabrique estos procesadores, pero la situación no mejora. Intel no puede producir suficientes procesadores y el mercado comienza a fijarse en unos mucho más interesantes Ryzen de AMD en los cuales no tienen problemas de producción; por lo que es mucho más sencillo de comprar, más rápido y encima son mucho más baratos.
Intel se encuentran estos momentos en una muy mala situación pero cuando parecía que ya habían tocado fondo... no, todavía quedan unos cuantos pisos más por bajar.