Anthropic lanza Claude Opus 4.8 con más control de esfuerzo y mejoras discretas en código y fiabilidad

por Edgar Otero 29/05/2026

Anthropic ha anunciado Claude Opus 4.8, una nueva revisión de su modelo de gama alta que llega apenas unas semanas después de Claude Opus 4.7. La compañía afirma que esta versión mejora a su predecesora en benchmarks, programación, tareas agentic y trabajo práctico de conocimiento, al tiempo que mantiene el mismo precio para el uso estándar. Junto al modelo, Anthropic ha presentado nuevas funciones como el control de esfuerzo en claude.ai, dynamic workflows en Claude Code y un fast mode más barato que en generaciones anteriores.

La firma sostiene que Claude Opus 4.8 es un "colaborador más eficaz" y que destaca sobre todo por una mayor "honestidad" cuando no tiene suficiente base para sostener una respuesta o cuando el trabajo realizado presenta dudas. Anthropic asegura que una de las mejoras más visibles está precisamente ahí, en reducir la tendencia de los modelos a dar por válida una respuesta que todavía no está suficientemente demostrada. Según sus propias pruebas, Claude Opus 4.8 sería cuatro veces menos propenso que Claude Opus 4.7 a dejar pasar sin comentar fallos en código que ha escrito.

Geeknetic Anthropic lanza Claude Opus 4.8 con más control de esfuerzo y mejoras discretas en código y fiabilidad 1 — Comportamiento desalineado de Opus 4.8, casi al nivel de Mythos

A estas alturas, que un modelo sea más "honesto" al equivocarse puede tener más valor real que una subida marginal en determinadas tablas comparativas, sobre todo en programación, revisión de código o flujos con agentes. En esos escenarios, detectar una incertidumbre a tiempo evita revisiones innecesarias o una falsa sensación de que la tarea ya está encarrilada. Dicho de otro modo, esta vez Anthropic no solo vende más capacidad, sino también una mejor gestión del error.

Una actualización funcional, pero también rutinaria

Anthropic acompaña el lanzamiento con varias novedades de producto. La más llamativa es Dynamic Workflows en Claude Code, una función en vista previa de investigación con la que Claude puede planificar trabajo y lanzar cientos de subagentes en paralelo dentro de una misma sesión para abordar tareas mucho más amplias, como migraciones de grandes bases de código. A eso se suma el nuevo control de esfuerzo en la web y Cowork, que permite elegir cuánto razonamiento dedica el modelo a cada respuesta, y un ajuste en la API para introducir entradas de sistema dentro del array de mensajes sin romper la caché del prompt.

Sobre el papel, todo esto refuerza la posición de Claude en desarrollo y automatización. Sin embargo, también deja una impresión cada vez más común, a saber, las versiones se suceden con demasiada rapidez. Hace apenas unas semanas, Anthropic lanzaba Claude Opus 4.7 y ahora llega Claude Opus 4.8 con un paquete de mejoras que, siendo sinceros, encaja más en una actualización de continuidad que en un salto de generación. No es que las mejoras estén mal. Solo es que quizá no sea necesario un gran anuncio repleto de benchmarks cada vez que se lanza un nuevo modelo.

Claude Opus 4.8 parece una revisión menor, útil para afinar posicionamiento y mantener presencia frente a movimientos recientes del mercado, como la llegada de GPT 5.5 (que, por cierto, llegó solo unos días después de Opus 4.7). Anthropic presenta mejoras en benchmarks y remite a su System Card para ampliar detalles, pero conviene recordar que estas pruebas sirven solo hasta cierto punto. El rendimiento real de un modelo depende de demasiados factores, a saber, prompts, herramientas, contexto, latencia, presupuesto de tokens, integración en producto y supervisión humana.

Más control, más coste potencial y una promesa a futuro

Anthropic explica además que Claude Opus 4.8 usa por defecto un nivel alto de esfuerzo, que considera el mejor equilibrio entre calidad y experiencia. Los usuarios podrán subir aún más ese esfuerzo con modos como extra o max, lo que debería mejorar resultados en tareas difíciles, aunque previsiblemente también aumentará el consumo. Es un matiz importante porque la compañía insiste en que el precio estándar no cambia, 5 dólares por millón de tokens de entrada y 25 por millón de salida, pero eso no impide que el coste final varíe si los flujos usan más razonamiento o más longitud de respuesta.

Anthropic, además, afirma que trabaja en modelos con capacidades similares a Opus a menor coste y, al mismo tiempo, en una nueva clase de sistemas más potentes, vinculados a Project Glasswing y Claude Mythos Preview. De momento, esos modelos siguen reservados por sus implicaciones en ciberseguridad. Por lo tanto, Claude Opus 4.8 queda como una mejor práctica y medible, aunque de perfil continuista.

Fin del Artículo. ¡Cuéntanos algo en los Comentarios!