Anthropic da marcha atrás y elimina las restricciones ocultas que limitaban Claude Fable 5 para investigadores
por Manuel NaranjoAnthropic lanzó Claude Fable 5 con una política interna no documentada que reducía el rendimiento del modelo ante determinadas consultas de investigación en inteligencia artificial. Tras la presión pública generada por investigadores y desarrolladores, la compañía se disculpó y eliminó esa política. La controversia ha puesto sobre la mesa una pregunta que el sector lleva tiempo esquivando: quién decide qué capacidades de la IA están disponibles para investigación independiente y en qué condiciones.
Qué hacía la restricción y por qué molestó
Claude Fable 5 es el primer modelo público de la familia Mythos, la clase de sistemas más avanzados que Anthropic ha puesto en producción. Cuando el modelo detectaba consultas relacionadas con áreas sensibles (ciberseguridad, biología, química avanzada o técnicas de extracción de conocimiento de modelos de IA), no rechazaba la petición directamente, sino que la redirigía de forma automática a Claude Opus 4.8, una versión con menor capacidad. El proceso ocurría sin notificación explícita al usuario, lo que generaba inconsistencias difíciles de detectar en entornos automatizados.
Según los datos que la propia empresa reconoció, este sistema afectaba a menos del 5 % de las sesiones totales. El problema es que ese porcentaje no se distribuía de forma uniforme, sino que se concentraba precisamente en los usuarios que realizan trabajo legítimo de investigación en seguridad: analistas de malware, equipos de pruebas de penetración autorizadas, investigadores que necesitan el modelo más capaz para tareas defensivas. Los filtros, en la práctica, generaban falsos positivos de forma sistemática.
Los científicos que denunciaron la situación apuntaron a un riesgo estructural más amplio: si las capacidades avanzadas de los modelos de IA de vanguardia quedan reservadas únicamente para un grupo selecto de empresas con acceso privilegiado, el avance de la ciencia independiente se ve comprometido. El argumento no es nuevo, pero adquiere más peso cuando viene de investigadores que han probado el sistema y documentado sus limitaciones.
La decisión del 10 de junio y la retirada de la política

Fue ayer, 10 de junio, cuando Anthropic anunció formalmente que retiraba la política restrictiva. La empresa reconoció que la medida había bloqueado consultas legítimas y que las críticas recibidas eran fundadas. Anthropic explicó que la restricción nacía de la consideración de que los modelos de la clase Mythos habían alcanzado un nivel de capacidad que exigía mayor control, pero admitió que la implementación no había sido la adecuada.
El momento de esta controversia no es menor. Anthropic se prepara para una posible salida a bolsa con una valoración cercana a los 965.000 millones de dólares, según datos que han circulado en medios especializados. En ese contexto, cualquier percepción de restricción encubierta hacia la comunidad investigadora tiene un coste reputacional directo. Anthropic necesita que la misma comunidad que evalúa y valida sus modelos confíe en sus procesos, y esta crisis ha erosionado parte de ese crédito. Nosotros ya cubrimos el lanzamiento de Claude Fable 5 y la reserva de Claude Mythos 5 para ciberdefensa, donde ya se advertía que la gestión de los límites de estos modelos iba a ser el principal punto de fricción.
Claude Mythos 5, la versión sin restricciones de uso general
En paralelo al lanzamiento de Fable 5, Anthropic mantiene activo Claude Mythos 5, que parte del mismo modelo base, pero con algunas salvaguardas desactivadas en determinadas áreas. El acceso a esta versión está restringido a un grupo muy reducido de organizaciones autorizadas, principalmente vinculadas a la ciberdefensa y la protección de infraestructuras críticas. No es accesible para el público general ni para la mayoría de los investigadores independientes.
Esta arquitectura de dos velocidades (un modelo público con filtros y uno privado sin ellos) es precisamente lo que ha alimentado el debate. Varios investigadores han señalado que la distinción entre uso legítimo y uso problemático no siempre puede establecerse a partir del perfil de quien accede al sistema, sino que depende del contexto concreto de cada consulta. Es un dilema que el sector no ha resuelto, y que también afecta a la conversación sobre cómo Anthropic gestiona el acceso a Claude Code y sus herramientas de agentes en un entorno cada vez más profesionalizado.
Una industria que busca un equilibrio que nadie ha encontrado
El episodio protagonizado por Fable 5 no es un caso aislado. Otros proveedores de modelos han optado por estrategias similares: un único modelo con filtros configurables según el cliente, sin las redirecciones implícitas que generaron la controversia de Anthropic. La diferencia es que la compañía eligió una solución técnicamente más opaca, lo que amplificó el malestar cuando se hizo pública.
Que la empresa haya dado marcha atrás en un plazo muy corto desde que la polémica estalló con fuerza sugiere que la presión del ecosistema investigador fue determinante. También indica que Anthropic es consciente de que su credibilidad como laboratorio de IA orientado a la seguridad depende, en parte, de no alienar a quienes trabajan en ese mismo campo desde fuera de sus muros. El debate sobre cómo equilibrar capacidades avanzadas con uso responsable sigue abierto, y este episodio ha dejado claro que resolverlo de forma unilateral y sin transparencia no funciona.
Fin del Artículo. ¡Cuéntanos algo en los Comentarios!



