
La AMD Radeon AI PRO 9700 en configuración de multiGPU ofrece hasta 1.780 tokens por segundo con 180 instancias concurrentes
por Juan Antonio SotoDurante el pasado COMPUTEX, AMD nos presentó su solución basada en RDNA 4 para profesionales, la Radeon AI PRO 9700. Una tarjeta que llega con 32 GB de VRAM GDDR6, lista para ofrecer configuraciones multiGPU que pueden con los lenguajes de Inteligencia Artificial más pesados. Aprovechando este evento Advancing AI donde hemos conocido más datos de sus procesadores para profesionales y entusiastas Threadripper 9000 y 9000 PRO Series, también ha aprovechado para ofrecer algunos datos más de sus Radeon AI PRO 9700.
La arquitectura RDNA 4 de la que forma parte esta Radeon AI PRO 9700 está fabricada con un proceso de 4 nanómetros de TSMC, y es compatible con PCIe 5.0. Además, admite hasta 32 GB de memoria VRAM con un bus de 256 bits que junto con memoria de 20 Gbps.
Características destacadas de la arquitectura RDNA 4
- Diseño Monolítico Optimizado
- Proceso de fabricación TSMC de 4nm
- Soporte para PCIe Gen 5
- Tamaño de chip: 356.5 mm² (53.9 mil millones de transistores)
- Procesador de Comandos Mejorado
- Aceleradores de paquetes optimizados
- Memoria GDDR6 de Alta Velocidad
- Hasta 256 bits a 20 Gbps con capacidad de 32 GB
- Compresión de memoria mejorada
- Sistema de Caché Optimizado
- 64 MB de Infinity Cache de 3ª generación
- 8 MB de caché L2
- 2 MB de caché agregada por unidad de cómputo (CU)
- Aceleradores de IA de 2ª Generación
- Mejora en tasas de procesamiento tensorial
- Nuevos tipos de datos de punto flotante de 8 bits
- Soporte para Structured Sparsity
AMD ha hecho hincapié en la necesidad de 32 GB de memoria VRAM que puede con lenguajes como DeepSeek R1 Distill 32B o Mistral Small 3.1 24B, también con lenguajs de texto a imagen como FLUX.1 Schell o Stable Diffusion 3.5 Medium.
En cuanto a la generación de tokens por segundo, en una configuración de una sola GPU, AMD ha comparado el rendimiento con la anterior Radeon PRO W7800. Este nuevo modelo es capaz de ofrecer hasta un 105% mas tokens por segundo, una cifra que se puede aumentar hasta los 1.780 con hasta 180 instancias de forma concurrente en configuraciones usando 4 de estas nuevas AMD Radeon.
El nuevo modelo cuenta con soporte para Sparsity, y es capaz de realizar el doble de operaciones FP16/BF16 y 4 veces más para INT8 e INT4. Estas capacidades ofrecen cifras de hasta 382.7 TOPS para INT8 en el nuevo modelo, respecto a los apenas 90 TOPS de la W7800 de la pasada generación.
Una tarjeta que estará disponible el próximo mes de julio, y de la que Gigabyte ya ha presentado su modelo que se sumará a los que llegarán de ASUS, ASRock, PowerColor, Sapphire, XFX o Yestone.
Fin del Artículo. ¡Cuéntanos algo en los Comentarios!