Arm y Google Cloud impulsan la IA agentica con los nuevos procesadores Axion

Arm y Google Cloud impulsan la IA agentica con los nuevos procesadores Axion

por Juan Antonio Soto

La colaboración entre Arm y Google Cloud marca un paso clave en la evolución de la inteligencia artificial agentica, un enfoque que va más allá de la inferencia tradicional para dar lugar a sistemas capaces de razonar, ejecutar tareas complejas y tomar decisiones en tiempo real. Esta nueva infraestructura se apoya en los procesadores Axion, basados en arquitectura Arm Neoverse, diseñados específicamente para responder a las exigencias de estos entornos avanzados.

La IA agentica impulsa nuevas necesidades en CPU y centros de datos

A diferencia de la IA convencional, que se basa en consultas puntuales a modelos, la IA agentica funciona mediante cadenas continuas de razonamiento, interacción con herramientas y acceso constante a datos. Esto incrementa de forma notable la concurrencia, la sensibilidad a la latencia y la demanda de operaciones de cómputo, situando a la CPU en el centro del rendimiento.

En este escenario, las soluciones basadas en Arm destacan por su eficiencia energética y capacidad para manejar grandes volúmenes de trabajo de forma continua.

TPU 8t, TPU 8i y Axion: la apuesta de Google por la integración total

Google Cloud ha presentado sus nuevos sistemas TPU 8t y TPU 8i, diseñados para separar cargas de entrenamiento e inferencia y optimizar cada escenario. Por primera vez, estos sistemas integran los procesadores Google Axion como base, lo que permite reducir la latencia en la preparación de datos y mantener los aceleradores trabajando sin interrupciones.

Esta estrategia forma parte de su visión de un “AI Hypercomputer”, donde CPU, aceleradores y software funcionan de manera conjunta y coordinada. Una estrategia optimizada y diseñada a conciencia para que este conjunto ofrezca una mejora con este tipo de tareas.

GKE Agent Sandbox permite ejecutar agentes de IA de forma segura y eficiente

Otro de los pilares de esta propuesta es el GKE Agent Sandbox, un entorno diseñado para ejecutar agentes de IA de forma segura incluso cuando trabajan con código no confiable. Esta plataforma permite alcanzar hasta 300 entornos por segundo por clúster, con una latencia inferior a un segundo hasta la primera instrucción. Gracias a tecnologías como gVisor y Kata Containers, se consigue un equilibrio entre seguridad, rendimiento y escalabilidad.

Axion mejora el rendimiento de la inferencia y reduce costes frente a GPU

Las máquinas virtuales C4A, basadas en Arm Neoverse V2, están optimizadas para cargas de inferencia paralelas y sensibles a la latencia, permitiendo ejecutar tareas de IA en CPU de propósito general. Esto reduce la dependencia de GPUs en determinados escenarios, mejorando la relación precio-rendimiento.

Empresas como loveholidays ya han comprobado en producción cómo esta aproximación permite escalar sistemas de IA en tiempo real con un coste reducido. Una oportunidad de ahorrar costes cuando el rendimiento no es crucial, ofreciendo una solución alternativa más liviana para tareas que así lo requiere.

En cuanto al rendimiento, Google también ha compartido pruebas concretas con su infraestructura basada en Axion, donde se ha utilizado el modelo Gemma-3-12B en un entorno con 48 vCPU. En este test, centrado en tareas de inferencia con generación de tokens por segundo, los procesadores Axion han logrado un 29 % más de rendimiento frente a soluciones basadas en AMD Turin y un 23 % más que sistemas con Intel Granite Rapids, todo ello en condiciones comparables.

Geeknetic Arm y Google Cloud impulsan la IA agentica con los nuevos procesadores Axion 1

Estos resultados refuerzan la apuesta de Google por las CPUs Arm como una alternativa eficiente para cargas de IA, especialmente en escenarios donde el rendimiento sostenido y el coste son factores clave.

Una plataforma completa que abarca desde la nube hasta el edge

La familia Axion incluye también soluciones como N4A, orientadas a cargas escalables como APIs o servicios web, y C4A Metal, una opción bare-metal que ofrece acceso directo al hardware sin virtualización. Este enfoque permite mantener consistencia entre entornos cloud y edge, algo clave para sectores como la automoción o infraestructuras empresariales avanzadas. Todo ello refuerza la estrategia de Arm de impulsar un ecosistema cada vez más amplio y preparado para la próxima generación de IA.

Fin del Artículo. ¡Cuéntanos algo en los Comentarios!

Redactor del Artículo: Juan Antonio Soto

Juan Antonio Soto

Soy Ingeniero Informático y mi especialidad es la automatización y la robótica. Mi pasión por el hardware comenzó a los 14 años cuando destripé mi primer ordenador: un 386 DX 40 con 4MB de RAM y 210MB de disco duro. Sigo dando rienda suelta a mi pasión en los artículos técnicos que redacto en Geeknetic. Dedico la mayor parte de mi tiempo libre a los videojuegos, contemporáneos y retro, en las más de 20 consolas que tengo, además del PC.

Comentarios y opiniones sobre: Arm y Google Cloud impulsan la IA agentica con los nuevos procesadores Axion ¿Qué opinas? ¿Alguna pregunta?