Claude Sonnet 4.6 supera a Opus 4.5 en programación y los usuarios lo prefieren el 59% de las veces

por Edgar Otero 17/02/2026

Apenas unos días de lanzar Claude Opus 4.6, Anthropic ha presentado Claude Sonnet 4.6, la nueva versión de su modelo intermedio que cierra la brecha con Opus 4.5, su modelo más potente lanzado en noviembre de 2025. El nuevo modelo mejora de forma significativa en programación, uso de ordenadores, razonamiento con contexto largo, planificación de agentes, trabajo de conocimiento y diseño. Además, incorpora una ventana de contexto de 1 millón de tokens en beta, suficiente para procesar bases de código completas, contratos extensos o docenas de artículos de investigación en una sola petición.

Lo más destacable es que los desarrolladores con acceso anticipado prefieren Sonnet 4.6 sobre su predecesor Sonnet 4.5 aproximadamente el 70% de las veces. Pero aún más llamativo: lo prefieren sobre Opus 4.5 el 59% de las ocasiones, especialmente por ser menos propenso a la sobreingeniería y seguir mejor las instrucciones. El precio se mantiene igual que Sonnet 4.5: desde 3 dólares por millón de tokens de entrada y 15 dólares por millón de tokens de salida.

Salto cualitativo en programación y control de ordenadores

En Claude Code, los usuarios reportan que Sonnet 4.6 lee mejor el contexto antes de modificar código y consolida la lógica compartida en lugar de duplicarla, haciéndolo menos frustrante en sesiones largas. Los usuarios destacan que genera menos alucinaciones, comete menos errores al reportar éxitos falsos y mantiene mejor la consistencia en tareas de múltiples pasos.

Pero quizás la mejora más espectacular se observa en el uso de ordenadores. Anthropic fue la primera compañía en introducir un modelo capaz de usar un ordenador de forma general en octubre de 2024, aunque admitieron que era "experimental, a veces torpe y propenso a errores".

Dieciséis meses después, los datos muestran un progreso notable. En OSWorld, el benchmark estándar que presenta cientos de tareas en software real como Chrome, LibreOffice o VS Code, Sonnet 4.6 ha alcanzado niveles de capacidad cercanos a los humanos en tareas como navegar hojas de cálculo complejas o rellenar formularios web de múltiples pasos.

El modelo también ha mejorado significativamente su resistencia a ataques de inyección de prompts, donde actores maliciosos intentan secuestrar el modelo escondiendo instrucciones en sitios web. Las evaluaciones de seguridad de Anthropic muestran que Sonnet 4.6 representa una mejora importante respecto a Sonnet 4.5 y rinde de forma similar a Opus 4.6 en este aspecto.

Contexto masivo y razonamiento a largo plazo

La ventana de contexto de 1 millón de tokens no es solo un número impresionante. Según Anthropic, Sonnet 4.6 razona de forma efectiva a través de todo ese contexto, lo que mejora sustancialmente su capacidad de planificación a largo plazo. Esto quedó demostrado en Vending-Bench Arena, una evaluación que simula la gestión de un negocio a lo largo del tiempo donde diferentes modelos compiten entre sí.

Sonnet 4.6 desarrolló una estrategia interesante. Invirtió fuertemente en capacidad durante los primeros diez meses simulados, gastando significativamente más que sus competidores, para después pivotar bruscamente hacia la rentabilidad en el tramo final. Esta planificación temporal le permitió terminar muy por delante de la competencia.

Los primeros clientes también reportan mejoras generalizadas, destacando especialmente el código frontend y el análisis financiero. Los resultados visuales de Sonnet 4.6 se describen como notablemente más pulidos, con mejores diseños, animaciones y sensibilidad estética que modelos anteriores, requiriendo menos iteraciones para alcanzar resultados listos para producción.

Claude Sonnet 4.6 está disponible desde hoy en todos los planes de Claude, incluyendo el gratuito, Claude Cowork, Claude Code, la API y las principales plataformas en la nube. El nivel gratuito también se ha actualizado para incluir creación de archivos, conectores, skills y compactación de contexto.

Fin del Artículo. ¡Cuéntanos algo en los Comentarios!