
IBM y AMD refuerzan su alianza con Zyphra para escalar modelos multimodales con IA abierta
por Manuel NaranjoIBM y AMD han sellado una colaboración plurianual para que Zyphra entrene modelos multimodales de última generación sobre IBM Cloud con GPU AMD Instinct MI300X y red acelerada AMD. No es un mero contrato de infraestructura: es una jugada para combinar cómputo a gran escala con una hoja de ruta de IA abierta que ambiciona resultados prácticos en empresas reales.
Qué aporta cada parte
Zyphra llega con financiación fresca y una meta clara: investigación en arquitecturas nuevas, memoria a largo plazo y aprendizaje continuo para su superagente Maia. IBM pone la capa industrial: seguridad, fiabilidad y nube híbrida con control de costes. AMD aporta el músculo: aceleradores MI300X y la capa de red y offload de Pensando (NIC Pollara 400 y DPU Ortano) que descarga tareas del host y mantiene alto el rendimiento del clúster.
Por qué este clúster es distinto
Entrenar modelos multimodales exige tres cosas: memoria masiva, ancho de banda sostenido y escalado eficiente. Las MI300X destacan por su gran HBM y por un diseño pensado para servir lotes grandes sin ahogarse en I/O. Si a eso se suma una interconexión de baja latencia y DPUs que alivian la red y el almacenamiento, el resultado es un tiempo de entrenamiento más corto y una curva de costes más predecible. La nube de IBM añade aislamiento, cumplimiento y capacidad de crecer en oleadas: la primera fase ya está operativa y se ampliará en 2026.
El papel de Maia en la empresa
Maia no aspira a ser “otro chatbot”. Nace como superagente multimodal: lenguaje, visión y audio en un único cerebro, con capacidad de razonar sobre documentos, imágenes, grabaciones y contextos de negocio. La promesa para el trabajador del conocimiento es tangible: preparar resúmenes que mezclen reuniones y reportes, convertir presentaciones en planes de acción o vigilar flujos de correo y tickets para priorizar tareas. Sin un clúster de este calibre, esa ambición se quedaría en “demo”.
IA abierta con ambición industrial
El matiz diferencial de Zyphra es la ciencia abierta. Publicar modelos y técnicas acelera el ecosistema y permite auditoría externa (sesgos, seguridad, consumo). La contrapartida es evidente: abrir facilita que terceros repliquen avances. IBM y AMD compensan con ventaja de ejecución: una plataforma donde escalar rápido, con acuerdos de suministro y capacity planning que evitan los cuellos de botella habituales.
Rendimiento y eficiencia, dos caras de lo mismo
La conversación ya no va solo de “quién entrena más rápido”, sino de a qué coste energético y con qué fiabilidad. Las MI300X están diseñadas para densidad de memoria por vatio, algo crítico en multimodal. Las DPUs reducen el ruido del sistema (interrupciones, pila de red) y mejoran la utilización de GPU. Y la capa de observabilidad de IBM Cloud permite medir deriva, throughput y consumo para afinar tanto el entrenamiento como la inferencia posterior.
Riesgos y puntos a vigilar
Hay tres frentes que conviene seguir de cerca.
- Suministro y escalado. El mercado de aceleradores sigue tensionado; mantener capacidad garantizada es clave para que los roadmaps de Zyphra no patinen.
- Coste total. El precio por token entrenado cae con buen hardware, pero también con ingeniería de datos: mezcla de tareas y checkpointing inteligente marcan la diferencia.
- Gobernanza. Modelos abiertos implican licencias claras, evaluación de seguridad y mecanismos de red-teaming continuos para evitar usos indebidos.
Más allá del clúster: IA y cómputo cuántico
La cooperación entre IBM y AMD no se queda en GPU. Ambas compañías exploran arquitecturas de próxima generación en las que la IA clásica convive con la supercomputación cuántica. No sustituye al entrenamiento actual, pero abre la puerta a tuberías híbridas donde determinadas subrutinas (optimización, muestreo, búsqueda) se beneficien de aceleradores especializados.
Qué significa para el sector
Para startups y empresas, el mensaje es doble. Por un lado, existen alternativas reales para entrenar a gran escala fuera del monopolio de siempre. Por otro, la nube híbrida ofrece un camino pragmático: combinar centros propios con capacidad bajo demanda sin reescribirlo todo. Si Zyphra convierte este clúster en modelos útiles y reutilizables, la industria ganará velocidad y diversidad.
La alianza IBM + AMD + Zyphra no es solo marketing. Reúne cómputo puntero, ingeniería de red y una filosofía abierta con vocación de impacto práctico. Si el despliegue mantiene ritmo y Maia demuestra tracción en casos reales, hablaremos de uno de los hitos de infraestructura de IA de esta etapa: menos excusas para no entrenar multimodal a gran escala y más opciones para llevar la IA (de forma responsable) al corazón del trabajo diario.
Fin del Artículo. ¡Cuéntanos algo en los Comentarios!