PCSpecialist Athena AI Pro Preview: un servidor de 80.000 € con 4 GPUs Blackwell y 384 GB de VRAM para IA local empresarial
por Javier Rodríguez Actualizado: Hace 1 hora 1Introducción a las prestaciones del PCSpecialist Athena AI Pro
Disponer de un potente sistema de inferencia de IA en empresas es posible gracias a soluciones como las que os presentamos hoy de PCSpecialist, una marca que no solo crea magníficos ordenadores personales y profesionales, sino auténticas bestias de proceso de IA el PCSpecialist Athena AI Pro al que hacemos hoy esta preview. No ha pasado directmente por nuestro laboratorio, pero si que hemos podido disfrutar de "tiempo de calidad" ejecutando nuestras pruebas en remoto. Las fotografías de esta preview han sido facilitadas por el equipo de PCSpecialist sobre la misma máquina de pruebas.
Construido sobre la base de un servidor ASUS y perfectamente equilibrado, con una CPU AMD EPYC en una configuración sencilla pero perfectamente equilibrada y centrada en la IA. Haciendo uso muy inteligente de tarjetas RTX 6000 de gama de estación de trabajo, que ofrecen un gran equilibrio entre precio, consumo y prestaciones, y una gran cantidad de RAM para ofrecer un entorno donde podamos apoyar al LLM o los LLM que ejecutemos con un contexto profundo y versátil, además de acceso a servicios de IA agéntica para transformar procesos y maximizar la productividad de los existentes.

Especificaciones y caracteristicas técnicas del PCSpecialist Athena AI Pro
- Servidor / Barebone: ASUS ESC4000A-E12.
- Formato: Rack 2U para centros de datos y despliegues IA empresariales.
- Procesador: AMD EPYC 9455.
- Núcleos / hilos: 48 núcleos y 96 hilos.
- Socket: Configuración monoprocesador SP5.
- Memoria RAM: 768 GB DDR5 ECC.
- Configuración RAM: 12 canales poblados con módulos de 64 GB.
- Relación RAM / VRAM: 2:1 respecto a la VRAM total instalada.
- Tarjetas gráficas: 4x NVIDIA RTX PRO 6000 Blackwell Max-Q Workstation Edition.
- Memoria gráfica total: 384 GB VRAM.
- VRAM por GPU: 96 GB GDDR7.
- Arquitectura GPU: NVIDIA Blackwell.
- Núcleos Tensor: Quinta generación.
- Núcleos RT: Cuarta generación.
- Uso orientado a: Inferencia IA, entrenamiento de modelos, renderizado profesional y computación científica.
- Slots PCI Express: Hasta 8x PCIe 5.0 x16.
- Capacidad de expansión: Preparado para múltiples GPU y aceleradores de red.
- Almacenamiento: Kingston DC3000ME U.2 PCIe.
- Capacidad SSD instalada: 6x 3.84 TB.
- Capacidad total SSD: 23.04 TB.
- Interfaz SSD: PCI Express NVMe U.2.
- Velocidad SSD: Hasta 14.000 MB/s.
- Rendimiento SSD: Hasta 2.7 millones de IOPS.
- Consumo SSD: Menos de 10 W por unidad.
- Conectividad de red: 2x slots OCP 3.0.
- Networking soportado: Adaptadores de fibra de alta velocidad.
- Ancho de banda máximo: Hasta 800 Gbps por enlace.
- Aceleradores de red compatibles: NVIDIA y AMD.
- Fuentes de alimentación: 2x PSU redundantes Titanium.
- Potencia PSU: 2600 W por fuente.
- Objetivo del sistema: Infraestructura IA empresarial de alta densidad.
El hardware generalista
Detrás de todo servidor para IA hay más que un buen puñado de potentes GPU capaces de manejar las cargas específicas de este tipo de procesos. Tan importantes como estas gráficas de última generación, que detallaremos en un momento, debe haber un hardware capaz de darles soporte.
En la configuración de este servidor de PCSpecialist Athena AI Pro encontramos la base perfecta para dar vida a una gran cantidad de estas gráficas en el entorno de software adecuado para ello.

PCSpecialist ha confiado esta creación en un barebone de servidor ASUS ESC4000A-E12 y creo que con muy buen criterio. Este barebone permite, en un formato compacto, usar hasta cuatro GPU de alto rendimiento, combinándolo con procesadores EPYC 9004/9005 de hasta 128 núcleos. No es el caso de esta configuración, usa un procesador más modesto, pero la utilizada por la marca es, a mi entender, suficiente para dar vida a su potente configuración para IA.
En su configuración de una sola CPU, PCSpecialist ha confiado en un AMD EPYC 9455 de 48 núcleos y 96 hilos de proceso para las cargas generalistas que ocurren también en sistemas tan especializados en IA, cuya carga principal está sin duda en los motores gráficos. 48 núcleos es más que suficiente y, además, se soporta con la cantidad más que adecuada de RAM.

Son 768 GB configuradas en 12 canales, que es lo que soporta esta CPU, con una capacidad de 64 GB por módulo y justo el doble de la VRAM instalada, lo que nos parece un equilibrio perfecto entre estos dos subsistemas que maximizará el rendimiento del sistema. Por otro lado, ocupamos todos los slots disponibles, así que el único upgrade pasaría por usar módulos más densos, algo que sinceramente no veo necesario en este nivel de configuración y densidad de GPU.

Otras características interesantes y a la vez fundamentales en este tipo de configuraciones son la capacidad de ampliación de este servidor: soporta hasta 8 slots PCI Express 5.0 de 16x, que consumirían toda la capacidad de ampliación del procesador, pero también múltiples slots de almacenamiento M.2/U2, que no es un elemento crítico en un sistema destinado a IA como este, donde el almacenamiento no suele ser crítico porque los modelos consumen mucha VRAM y mucha RAM, pero no tanto espacio en disco.
Lo que sí es importante es la capacidad de conectividad de red, y este servidor tiene dos slots OCP 3.0 que podemos poblar con conectividad de red basada en fibra de la más alta velocidad, incluidos los aceleradores de red más rápidos de AMD o NVIDIA con capacidades de hasta 800 Gbps por enlace, y esto sí que es crítico en un sistema que podemos interconectar con otros servidores similares o simplemente para tener una respuesta óptima de los modelos de IA en ejecución o aprendizaje en el servidor. Implementar IA debe ser una solución holística que cubra cualquier aspecto; sin una conectividad de red adecuada, estos sistemas limitan mucho sus capacidades reales.

Para el almacenamiento, PCSpecialist no se la juega e incorpora varias unidades Kingston DC3000ME. Son unidades U.2 con conectividad PCI Express, con velocidades de transferencia de hasta 14.000 MB/s y potencia de proceso cercana a los 2,7 millones de IOPS. Estas unidades ofrecen además excelentes opciones de capacidad, desde los 3,84 TB (las utilizadas en esta unidad) hasta los 30,72 TB. Todo con un consumo de menos de 10 W.
Todo esto está soportado por un sistema de fuentes redundantes de eficiencia Titanium y 2600 W de potencia por cabeza, para que podamos estar seguros de que la estabilidad energética de todo el sistema no estará comprometida, algo importante puesto que las gráficas utilizadas tienen un consumo bastante elevado.
Configuración masiva de GPU para IA
PCSpecialist ha configurado este servidor con una combinación de GPU de NVIDIA basadas en la arquitectura Blackwell, la más potente para entorno de estación de trabajo y que permiten a este servidor acceder a niveles de rendimiento sobresalientes en una configuración de hardware accesible; accesible en cuanto a lo que necesitamos de infraestructura, porque en lo que es a precio, sin duda supone una inversión potente pero también bastante más controlada que las versiones de “servidor” de esta generación.
La NVIDIA RTX PRO 6000 Blackwell Max-Q Workstation Edition 96 GB, de las cuales se han instalado cuatro unidades, se sitúa en la cima de las GPU profesionales de nueva generación, basada en la arquitectura Blackwell de NVIDIA, diseñada específicamente para cargas de trabajo intensivas en IA, renderizado y computación científica.
Desde el punto de vista de arquitectura, introduce mejoras sustanciales en los Streaming Multiprocessors (SM) junto con núcleos Tensor de quinta generación y núcleos RT de cuarta generación, lo que permite una aceleración significativa tanto en inferencia como en entrenamiento de modelos.

Su capacidad teórica alcanza aproximadamente 3511 TOPS en operaciones de IA, lo que refleja un salto notable frente a generaciones anteriores, especialmente gracias al soporte de precisión FP4 y técnicas de sparsity, optimizadas para redes neuronales modernas.
En términos de subsistema de memoria, la GPU integra 96 GB de memoria GDDR7 con ECC, acompañada de un ancho de banda de aproximadamente 1,79 TB/s, lo cual resulta crítico para workloads que requieren grandes datasets en memoria, como modelos de lenguaje de gran tamaño (LLM) o simulaciones científicas complejas.
Este volumen de VRAM elimina en muchos casos la necesidad de particionar datos o recurrir a memoria del sistema, reduciendo la latencia y aumentando la eficiencia. Además, el uso de ECC (Error Correction Code) posiciona esta GPU en el ámbito empresarial, donde la integridad de datos es esencial. ECC no solo reduce los errores, sino que estabiliza el sistema de forma sustancial y mantiene la integridad con el hardware generalista, que también está protegido de la misma forma.

El bus PCIe 5.0 x16 proporciona suficiente ancho de banda para evitar cuellos de botella en transferencias host-device, especialmente en configuraciones multi-GPU como es el caso de este servidor. Su ancho de banda hacia otras GPU instaladas en el sistema es de hasta 128 Gbps.
Uno de los aspectos más relevantes de la variante Max-Q es su enfoque en la eficiencia energética, lo que la hace más flexible en configuraciones de múltiples GPU en sistemas de configuración tradicional, sin elementos de refrigeración muy especializados.
Con un TDP aproximado de 300 W, esta versión reduce significativamente el consumo respecto a la variante estándar de workstation (que puede alcanzar hasta 600 W), sacrificando una pequeña fracción del rendimiento en favor de una mejor relación rendimiento/vatio. Las cuatro instaladas en este servidor consumen alrededor de 1400 W en plena carga, lo que deja mucho margen de potencia a las fuentes utilizadas, en una configuración redundante de 2600 W.
Todo esto supone, en configuraciones escaladas como esta, disponer de hasta 384 GB de memoria combinada, lo cual es especialmente útil en entornos de IA distribuida, renderizado en red o análisis masivo de datos. Además, la inclusión de múltiples motores NVENC/NVDEC de última generación habilita pipelines de vídeo profesionales con codificación acelerada por hardware, incluyendo soporte para formatos de alta precisión como 10-bit 4:2:2, aunque no es el objetivo de este servidor.
Desde una perspectiva de uso real, esta GPU está claramente orientada a estaciones de trabajo avanzadas y no a consumo general. Su diseño de doble ranura con refrigeración activa optimizada permite mantener frecuencias sostenidas bajo cargas prolongadas, algo crucial en simulaciones, entrenamiento o explotación continua de modelos.
No deja de ser una solución para estación de trabajo; no cuenta con elementos empresariales como NVLink (un potente interfaz para comunicar GPU con GPU desarrollado por NVIDIA), pero sin duda reduce los costes de forma sustancial en este tipo de entornos y los resultados son realmente sorprendentes en rendimiento. Eso equilibra la balanza: perdemos velocidad de comunicación y otras prestaciones, pero el retorno de la inversión, y la inversión misma, es mucho más asumible.
NVIDIA RTX PRO 6000 Blackwell Max-Q Workstation Edition 96 GB
- Arquitectura:
- NVIDIA Blackwell
- Chip GB202 completo
- Proceso TSMC 4N / 5 nm
- Núcleos:
- 24.064 CUDA Cores
- 752 Tensor Cores (5ª generación)
- 188 RT Cores (4ª generación)
- IA:
- Hasta 3511 AI TOPS FP4
- Soporte FP4 / FP8
- DLSS 4
- RTX Neural Shaders
- Optimizada para inferencia LLM y agentes IA locales
- Memoria:
- 96 GB GDDR7 ECC
- Bus de 512-bit
- 1792 GB/s de ancho de banda
- Rendimiento bruto:
- ~110 TFLOPS FP32
- ~333 TFLOPS RT
- Cerca de 4 PFLOPS FP4 sparse teóricos
- Frecuencias:
- Base ~1590 MHz
- Boost ~2288 MHz
- Consumo:
- 300W TGP
- Mucho más eficiente que la versión Workstation de 600W
- Diseñada para workstations multi-GPU densas
- Formato:
- Dual-slot
- Refrigeración activa tipo blower
- PCIe 5.0 x16
- 1x conector 16-pin 12V-2x6
- Vídeo:
- 4x DisplayPort 2.1b
- 4x NVENC 9ª Gen
- 4x NVDEC 6ª Gen
- Preparada para edición 8K, AV1 y pipelines IA de vídeo
- Multi GPU:
- Hasta 4 GPUs en workstation
- Hasta 384 GB VRAM combinada
- Compatible con scale-out moderno sin NVLink
- Casos de uso ideales:
- LLMs grandes locales
- Fine tuning
- Stable Diffusion XL y vídeo IA
- Omniverse
- Unreal Engine
- Blender / Cycles
- V-Ray
- Simulación científica
- CAD extremo
- Bases de datos GPU
- Inferencia enterprise
- Aspectos clave:
- Combina características de una RTX 5090, una GPU de servidor y una Quadro profesional
- Incluye ECC y drivers enterprise certificados
- Gran cantidad de VRAM en formato workstation real
- Diferencia frente a la RTX PRO 6000 Workstation Edition:
- Misma VRAM y mismo chip
- Versión Max-Q: 300W
- Versión Workstation: 600W
- La Max-Q ofrece aproximadamente el 90% del rendimiento con mucho menor consumo y ruido
- Precio estimado:
- ~8.500 - 10.000 USD por GPU
- Lo que la hace especial:
- 96 GB VRAM en una sola GPU
- Solo 300W de consumo
- Drivers workstation certificados
- Una de las GPUs más equilibradas para IA local avanzada
Rendimiento general
El funcionamiento de la parte "generalista" de este servidor ofrece unas prestaciones sólidas, con un procesador de 48 núcleos que funciona como se espera de él, sin problema de temperatura. Con temperaturas y frecuencias de trabajo completamente dentro de sus paremetros de uso.
Resultados comparativos de la CPU
| Benchmark | Intel Xeon 6980P 128C | Intel Xeon 6780E 144C | AMD EPYC 9965 192C | AMD EPYC 9755 128C | AMD EPYC 9455 48C |
| Linux Kernel Compilation 6.8 (s, menos es mejor) | 208 | 266 | 159 | 117 | 268 |
| Node.js Compilation 21.7.2 (s) | 127 | 157 | 116 | 106 | 182 |
| LLVM Compilation 16.0 (s) | 171 | 126 | 117 | 106 | 188 |
| OpenSSL 3.3 SHA256 | 3584 | 3112 | 3842 | 4051 | 1540 |
| John The Ripper WPA PSK | 1,026,541 | 1,008,302 | 645,348 | 483,554 | 228,233 |
| PostgreSQL 16 | 8,642 | 4,609 | 5,215 | 5,011 | 2,420 |
| RocksDB 8.8 | 1,259 | 1,216 | 1,105 | 1,056 | 512 |
| CoreMark 1.0 | 9,482 | 8,620 | 7,573 | 6,771 | 3,180 |
| QuantLib 1.32 | 620 | 603 | 512 | 436 | 208 |
| Blender 4.1 (s, menos es mejor) | 66 | 96 | 87 | 37 | 118 |
| OSPRay 3.1 | 72 | 63 | 56 | 56 | 26 |
| nginx/UGI 0.4.1 | 43 | 42 | 40 | 39 | 18 |
| Stockfish 16.1 | 252 | 232 | 193 | 180 | 86 |
| Consumo medio (W) | 311 | 116 | 244 | 235 | 225 |
Rendimiento IA
Lo primero que hemos querido comprobar es si un sistema complejo como este, con cuatro GPUs, es capaz de escalar adecuadamente sus capacidades de proceso en paralelo en entornos de carga de inferencia en modelos LLM. No solo ver si podemos aprovechar bien las GPUs, sino también en qué entorno de trabajo se mueve, es decir, consumos y temperaturas.

En la captura podéis ver que la paralelización es casi perfecta. Ahora os damos números concretos, y las temperaturas de trabajo de las GPUs rondan los 55 grados, perfectas para una carga continuada en el tiempo. También hemos podido comprobar que los consumos están más alrededor de los 200 W que de los 300 W que indican las especificaciones máximas de NVIDIA. Eso les da margen, pero también permite un sistema más solvente y estable.
Datos de rendimiento en IA
| Modelo | Precisión | VRAM uso | 1× GPU (tok/s) | 4× GPU (tok/s) | Escala 4× |
| Llama 3.1 8B | BF16 | ~16 GB |
8990 |
28000 |
3.1× |
| Qwen 3.5 9B | BF16 | ~18 GB |
5450 |
17000 |
3.1× |
| Qwen 3.5 9B | AWQ 4-bit | ~10 GB |
5100 |
16002 |
3.2× |
| Qwen 2.5 14B | FP8 | ~14 GB |
5160 |
16500 |
3.2× |
| Qwen 3 30B MoE | AWQ | ~18 GB |
8425 |
26800 |
3.2× |
| Qwen 2.5 32B | FP16 | ~64 GB |
3140 |
6500 |
2.1× |
| DeepSeek R1 32B | BF16 | ~64 GB |
2200 |
5800 |
2.6× |
| Llama 3.3 70B | INT4 AWQ | ~35 GB |
2850 |
9600 |
3.4× |
| Qwen 2.5 72B | INT4 AWQ | ~36 GB |
3190 |
10200 |
3.2× |
| Nemotron 70B | INT4 AWQ | ~35 GB |
2850 |
9500 |
3.3× |
| GPT-OSS 120B | INT4 | ~62 GB |
1900 |
6800 |
3.6× |
| Mistral Large 123B | INT4 AWQ | ~62 GB |
1850 |
6600 |
3.6× |

Análisis y conclusión
El rendimiento general del PCSpecialist Athena AI Pro, el rendimiento clásico de CPU, almacenamiento y memoria, está dentro de lo esperado. El hardware es excelente y, sin duda, sería un gran servidor generalista, pero también es verdad que está lejos de ofrecer las configuraciones más avanzadas de CPU que podemos encontrar en el mercado.
Sí está muy equilibrado a nivel de recursos, con una buena cantidad de RAM y almacenamiento rápido y flexible. Podemos ampliar sus capacidades conectivas con las mejores soluciones del mercado y el formato de servidor de 2U es fantástico, sobre todo si vemos las capacidades de proceso IA que presenta.

Creo que la elección de las NVIDIA RTX PRO 6000 Blackwell Max-Q Workstation Edition 96 GB es muy inteligente porque su consumo más controlado y su precio más “llevadero” son perfectos para este formato y, por otro lado, ofrecen un retorno, como hemos visto en nuestras pruebas de rendimiento, realmente espectacular.
En nuestras pruebas de IA no solo vemos un rendimiento espectacular, sino consumos muy equilibrados y una escalabilidad sorprendente usando las cuatro GPU en cargas elevadas. Prácticamente el rendimiento se cuadruplica, sin pérdida, cuando usamos las cuatro gráficas en paralelo con respecto al uso de una única tarjeta.
El precio de esta unidad puede parecer elevado, cerca de los 75000 euros, pero si nos centramos en los precios de ciertos componentes y que tiene nada menos que cuatro GPUs de alta gama, las cosas se van situando en un precio realmente realista y competitivo. El desglose quedaría así:
- 4× GPU RTX PRO 6000 Max-Q — 54,2%
- RAM 768 GB DDR5 ECC RDIMM — 14,8%
- Barebone ASUS ESC4000A-E12 — 10,6%
- 6× SSD Kingston DC3000ME 3.84TB — 13,2%
- CPU AMD EPYC 9455 — 7,2%
El servidor es espectacular, con un aspecto cuidado y un rendimiento sólido. Una demostración más de cómo una empresa europea puede ofrecer la máxima calidad y precios competitivos también en un mercado tan especializado como este.
Fin del Artículo. ¡Cuéntanos algo en los Comentarios!



