IBM y AMD refuerzan su alianza con Zyphra para escalar modelos multimodales con IA abierta

IBM y AMD refuerzan su alianza con Zyphra para escalar modelos multimodales con IA abierta

por Manuel Naranjo

IBM y AMD han sellado una colaboración plurianual para que Zyphra entrene modelos multimodales de última generación sobre IBM Cloud con GPU AMD Instinct MI300X y red acelerada AMD. No es un mero contrato de infraestructura: es una jugada para combinar cómputo a gran escala con una hoja de ruta de IA abierta que ambiciona resultados prácticos en empresas reales.

Qué aporta cada parte

Zyphra llega con financiación fresca y una meta clara: investigación en arquitecturas nuevas, memoria a largo plazo y aprendizaje continuo para su superagente Maia. IBM pone la capa industrial: seguridad, fiabilidad y nube híbrida con control de costes. AMD aporta el músculo: aceleradores MI300X y la capa de red y offload de Pensando (NIC Pollara 400 y DPU Ortano) que descarga tareas del host y mantiene alto el rendimiento del clúster.

Por qué este clúster es distinto

Entrenar modelos multimodales exige tres cosas: memoria masiva, ancho de banda sostenido y escalado eficiente. Las MI300X destacan por su gran HBM y por un diseño pensado para servir lotes grandes sin ahogarse en I/O. Si a eso se suma una interconexión de baja latencia y DPUs que alivian la red y el almacenamiento, el resultado es un tiempo de entrenamiento más corto y una curva de costes más predecible. La nube de IBM añade aislamiento, cumplimiento y capacidad de crecer en oleadas: la primera fase ya está operativa y se ampliará en 2026.

El papel de Maia en la empresa

Maia no aspira a ser “otro chatbot”. Nace como superagente multimodal: lenguaje, visión y audio en un único cerebro, con capacidad de razonar sobre documentos, imágenes, grabaciones y contextos de negocio. La promesa para el trabajador del conocimiento es tangible: preparar resúmenes que mezclen reuniones y reportes, convertir presentaciones en planes de acción o vigilar flujos de correo y tickets para priorizar tareas. Sin un clúster de este calibre, esa ambición se quedaría en “demo”.

Geeknetic IBM y AMD refuerzan su alianza con Zyphra para escalar modelos multimodales con IA abierta 1

IA abierta con ambición industrial

El matiz diferencial de Zyphra es la ciencia abierta. Publicar modelos y técnicas acelera el ecosistema y permite auditoría externa (sesgos, seguridad, consumo). La contrapartida es evidente: abrir facilita que terceros repliquen avances. IBM y AMD compensan con ventaja de ejecución: una plataforma donde escalar rápido, con acuerdos de suministro y capacity planning que evitan los cuellos de botella habituales.

Rendimiento y eficiencia, dos caras de lo mismo

La conversación ya no va solo de “quién entrena más rápido”, sino de a qué coste energético y con qué fiabilidad. Las MI300X están diseñadas para densidad de memoria por vatio, algo crítico en multimodal. Las DPUs reducen el ruido del sistema (interrupciones, pila de red) y mejoran la utilización de GPU. Y la capa de observabilidad de IBM Cloud permite medir deriva, throughput y consumo para afinar tanto el entrenamiento como la inferencia posterior.

Riesgos y puntos a vigilar

Hay tres frentes que conviene seguir de cerca.

  1. Suministro y escalado. El mercado de aceleradores sigue tensionado; mantener capacidad garantizada es clave para que los roadmaps de Zyphra no patinen.
  2. Coste total. El precio por token entrenado cae con buen hardware, pero también con ingeniería de datos: mezcla de tareas y checkpointing inteligente marcan la diferencia.
  3. Gobernanza. Modelos abiertos implican licencias claras, evaluación de seguridad y mecanismos de red-teaming continuos para evitar usos indebidos.

Más allá del clúster: IA y cómputo cuántico

La cooperación entre IBM y AMD no se queda en GPU. Ambas compañías exploran arquitecturas de próxima generación en las que la IA clásica convive con la supercomputación cuántica. No sustituye al entrenamiento actual, pero abre la puerta a tuberías híbridas donde determinadas subrutinas (optimización, muestreo, búsqueda) se beneficien de aceleradores especializados.

Qué significa para el sector

Para startups y empresas, el mensaje es doble. Por un lado, existen alternativas reales para entrenar a gran escala fuera del monopolio de siempre. Por otro, la nube híbrida ofrece un camino pragmático: combinar centros propios con capacidad bajo demanda sin reescribirlo todo. Si Zyphra convierte este clúster en modelos útiles y reutilizables, la industria ganará velocidad y diversidad.

La alianza IBM + AMD + Zyphra no es solo marketing. Reúne cómputo puntero, ingeniería de red y una filosofía abierta con vocación de impacto práctico. Si el despliegue mantiene ritmo y Maia demuestra tracción en casos reales, hablaremos de uno de los hitos de infraestructura de IA de esta etapa: menos excusas para no entrenar multimodal a gran escala y más opciones para llevar la IA (de forma responsable) al corazón del trabajo diario.

Fin del Artículo. ¡Cuéntanos algo en los Comentarios!

Redactor del Artículo: Manuel Naranjo

Manuel Naranjo

Ingeniero informático y Técnico Superior en Topografía, que dejó las obras por su pasión: la tecnología. Desde hace ya varios años me dedico a lo que me gusta, con eso lo digo todo. Mi filosofía es el trabajo y la ilusión, no conozco otra forma de conseguir las cosas. El motor (sobre todo la F1) y el basket, mis vicios confesables.

Comentarios y opiniones sobre: IBM y AMD refuerzan su alianza con Zyphra para escalar modelos multimodales con IA abierta ¿Qué opinas? ¿Alguna pregunta?