
Intel ClearWater Forest, arquitectura de los nuevos Xeon 6+
En esta nueva generación de procesadores Xeon, denominada Intel Xeon 6+, Intel incorpora sus nuevos procesos de fabricación y empaquetado para lograr el procesador Xeon más denso hasta la fecha, con el doble de núcleos por procesador y sustentado en sus núcleos de eficiencia Intel Darkmont.

Los primeros procesadores Xeon basados en grandes estructuras de núcleos de eficiencia fueron los Intel 6 basados en la arquitectura Sierra Forest, los cuales ya tuve oportunidad de probar a mediados de 2024. Estos procesadores contaban con un proceso de fabricación Intel 3, 8 canales de memoria y hasta 144 núcleos de eficiencia que podíamos montar en configuraciones de hasta dos CPU por placa base. El Intel® Xeon® 6780E, basado en Sierra Forest, triplicaba la eficiencia de soluciones anteriores, con hasta 5 veces más capacidad de entrega de datos. Se basaba en una única baldosa de computación Intel 3 con baldosas base Intel 7.

El diseño y arquitectura de ClearWater Forest permite doblar el rendimiento manteniendo el mismo perfil de energía, con 1,9 veces más ancho de banda gracias a la incorporación de Intel 18A como proceso de fabricación del transistor y la tecnología Foveros Direct 3D, que permite apilar baldosas unas sobre otras en el diseño tridimensional más avanzado de Intel hasta la fecha y que ya está funcionando a pleno rendimiento en dos de sus plantas de fabricación Intel Foundries en Arizona y Oregón.
Con la incorporación del nuevo núcleo de eficiencia Darkmont, Intel consigue doblar la densidad de estas CPU, con hasta 288 núcleos E-Core y añadir casi el doble de ancho de banda contando con 12 canales de memoria DDR5 con velocidades de hasta 8000 MT/s.
El diseño de la nueva arquitectura incluye cinco componentes diferentes, a diferencia de Sierra Forest. Se mantienen los “I/O Tiles”, “EMIB” y los “Compute Tiles”, y se añaden nuevos “Base Tiles” y “Foveros Direct 3D” para apilar diferentes componentes en 3 dimensiones. Con ello se pasa de un diseño basado en dos procesos de fabricación, Intel 7 e Intel 3, a uno más complejo con Intel 18A, Intel 3 e Intel 7.
EMIB sigue siendo la base de comunicación entre las diferentes baldosas, al menos las bases activas y la de comunicación, que sigue basada en Intel 7. Pero ahora las 12 baldosas de computación (Intel 18A), antes era una sola, se sitúan encima de 3 baldosas activas (Intel 3) que hacen de base; ahora iremos con los detalles.
Intel 7
- Es un nodo de proceso avanzado de 10 nm mejorado, optimizado para ofrecer mayor rendimiento por vatio.
- Se utiliza en productos de alto rendimiento y eficiencia energética, como CPUs para servidores, Intel lo uso por primera vez en servidores con los Intel Sapphire Rapids.
- Permite frecuencias más altas y mejoras en densidad de transistores respecto a generaciones anteriores.
Intel 3
- Evolución de Intel 7, con mejoras en la fotolitografía EUV (Extreme Ultraviolet Lithography).
- Los Intel Sierra Forest, Xeon 6, fueron los primeros procesadores de Intel con este proceso de fabricacion, que ahora se usa en las bases de cache de Intel Xeon 6+
Intel 18A
- Es un nodo de proceso de nueva generacion, estrenado en los nucleos de proceso de Intel ClearWater Forest, Xeon 6+, e Intel Panther Lake para dispositivos portatiles y edge de bajo consumo y alta eficiencia.
- Introduce tecnologías como RibbonFET (nuevo transistor tipo gate-all-around) y PowerVia (alimentación por la parte posterior del chip).
La construcción mediante proceso Intel 18A permite seguir reduciendo el tamaño del transistor, situando la puerta de encendido/apagado rodeando completamente las láminas de silicio. De este modo se aumenta la densidad, se reduce la pérdida de señal y la pérdida de energía, sobre todo en estados “off”. Con PowerVIA se sitúa la potencia en la parte reversa y la señal de conexión en la anversa —tenéis más detalles aquí—, con reducción de materiales, disminución de la congestión, mejora de la señal y del rendimiento.
Foveros Direct 3D es la tecnología de empaquetado que permite a Intel colocar las nuevas baldosas de computación sobre las baldosas base. Lo consigue mediante una conexión directa, cobre a cobre, de tan solo 9 micrómetros, de baja resistencia y con un rendimiento energético sorprendente de 0,05 picojulios por bit.
Este diseño permite un escalado sorprendente en los componentes de este procesador, lo que le hace combinar una densidad desconocida de núcleos con una conectividad sorprendente. Los I/O Tiles añaden 8 aceleradores por baldosa, y recordemos que hay dos en cada procesador, 48 líneas PCI Express 5.0, 32 líneas CXL 2.0, 96 líneas UPI 2.0 por baldosa. Un diseño que, además, Intel reaprovecha de Granite Rapids en un diseño de componentes heterogéneos que funcionan gracias a la comunicación EMIB entre ellos.
En las nuevas baldosas “base” encontramos 192 MB de caché por base —tenemos tres en total—, 48 MB por cada baldosa de computación. También encontramos el controlador de memoria DDR5, con cuatro canales por baldosa base. Esto hace un total de 576 MB de caché, cinco veces más que la generación anterior, con 12 canales de memoria DDR5. Una vez más, EMIB es el pegamento que permite la comunicación entre estas baldosas.
Encima de cada baldosa base, cuatro elementos o baldosas de computación, cada una con seis módulos E-Core con arquitectura Darkmont, con cuatro núcleos cada uno. Son 24 núcleos por cada baldosa, con 4 MB de caché L2 por cada una de ellas, 1 MB por módulo. Un total de hasta 288 núcleos por procesador, cifras que doblan las de la anterior generación con el mismo perfil de energía.
Las diferentes unidades de que se compone Darkmont ofrecen una ventaja sustancial sobre la generación anterior, basada en el ya potente Crestmont, tanto que nos puede llevar a pensar que el camino de nuevas generaciones de procesadores de servidor, cada vez con más aceleradores muy especializados, pasa por este camino: el de maximizar la conectividad y el rendimiento por vatio.
Crestmont (Sierra Forest) | Característica | Darkmont (Clearwater Forest) |
---|---|---|
- | Branch predictor | Wider & deeper |
6-wide | Decode | 9-wide |
6-wide | Allocate | 8-wide |
64 entries | uOp queue | 96 entries |
256 entries | ROB window | 416 entries |
17 ports | Dispatch | 26 ports |
4 ALUs | Scalar ALUs | 8 ALUs |
2x128b | Vector FMAs | 4x128b |
2 AGUs | Address generation | 4 AGUs |
64B/cycle | L2 bandwidth | 128B/cycle |
Cuenta con un 50 % más en casi todos los ámbitos importantes de un procesador, incluyendo una nueva unidad “branch predictor”, más capacidad de codificación y decodificación, más puertos, el doble de unidades aritméticas, el doble de capacidad de cálculo vectorial y una caché L2 con el doble de ancho de banda. El salto generacional es simplemente impresionante y estos núcleos también los encontraremos en los nuevos Panther Lake para dispositivos portátiles y Edge.

Con estos números, Intel presume de 1,9 veces de mejora en el rendimiento con respecto al Intel® Xeon® 6780E Processor, 23 % de mejora en la eficiencia rendimiento-vatio y un ratio de consolidación 8:1 con respecto a procesadores de cinco años de antigüedad (cada rack basado en Intel Xeon 6+ podría sustituir a 8 racks con procesadores de hace cinco años).
El doble de núcleos, doble de aceleradores Intel, más líneas PCI Express, soporte para memorias más rápidas, cinco veces más caché L3, hasta 288 MB de caché L2 con el doble ancho de banda, y configuraciones comerciales que prometen el mismo perfil de energía de 330 W de la generación anterior pero aún con muchos detalles comerciales que detallar.
- Plataforma
- Sockets: 1S - 2S (compatible con Xeon 6900P)
- TDP máximo: 300 a 500W por CPU
- Cómputo y Memoria
- Núcleos: hasta 288 núcleos eficientes
- Cache L2: hasta 288MB (hasta 4MB por clúster)
- Último nivel de caché: 576MB
- Memoria: 12 canales DDR5 8000MT/s
- Interconexiones
- Intel® UPI: hasta 6 UPI 2.0 (hasta 24 GT/s por carril)
- PCI Express: hasta 96 carriles PCIe 5.0 (x16, x8, x4, x2)
- Compute Express Link: hasta 64 carriles CXL 2.0
- Seguridad y Eficiencia
- Seguridad: Intel Software Guard Extensions (Intel SGX), Intel Trust Domain Extensions (Intel TDX)
- Gestión de energía: Intel Application Energy Telemetry (Intel AET), Intel Turbo Rate Limiter
- Aceleración
- Aceleración: Intel Advanced Vector Extensions 2 (VNNI/INT8)
- Aceleradores integrados (hasta 16 aceleradores):
- 4x Intel QuickAssist Technology
- 4x Intel Dynamic Load Balancer
- 4x Intel Data Streaming Accelerator
- 4x Intel In-memory Analytics Accelerator
Estos procesadores llegarán durante 2026, con configuraciones de frecuencia de trabajo que no deberían distar mucho de las actuales. Aquí la mejora está en las optimizaciones de los núcleos de nueva generación y en su mayor densidad de núcleos y caché gracias al complejo e inteligente empaquetado tridimensional de Intel, que combina elementos de tres generaciones o procesos de fabricación diferentes.
Fin del Artículo. ¡Cuéntanos algo en los Comentarios!