Anthropic vuelve a implementar Claude Fable 5 el 1 de julio después del levantamiento de los controles de exportación de EE. UU. y agrega un nuevo clasificador de ciberseguridad

Anthropic está redesplegando Claude Fable 5, su modelo más capaz disponible en general. El 30 de junio anunció que se habían levantado los controles a las exportaciones estadounidenses. Los controles habían cubierto Claude Fable 5 y Claude Mythos 5. Fable 5 regresó a los usuarios de todo el mundo el miércoles 1 de julio. El acceso a Mythos 5 se restableció para un conjunto de organizaciones estadounidenses.

Los modelos fueron retirados el 12 de junio. Una directiva del gobierno estadounidense los restringió a los no extranjeros. Anthropic no pudo verificar la nacionalidad en tiempo real. Por lo que suspendió ambos modelos para todos.

Este artículo explica qué desencadenó el bloqueo. Cubre la nueva salvaguardia y el marco de jailbreak propuesto. También muestra cómo se compara Fable 5 con rivales como GLM-5.2.

Datos breves

Modelo: Claude Fable 5 (un modelo de clase Mythos hecho seguro para uso general) Evento: Redistribuido el 1 de julio de 2026 después de que se levantaron los controles de exportación Motivo de la pausa: Un informe de Amazon sobre una omisión de salvaguardia Solución: Un nuevo clasificador de seguridad que bloquea la técnica reportada Precio: $10 por millón de tokens de entrada, $50 por millón de tokens de salida Dónde: Claude Platform, Claude.ai, Claude Code, Claude Cowork

Qué pasó: la línea de tiempo

Anthropic lanzó Fable 5 y Mythos 5 el 9 de junio. Ambos comparten el mismo modelo subyacente. Fable 5 se envía con fuertes protecciones para uso general. Mythos 5 ha eliminado algunas salvaguardas para los socios de ciberseguridad defensivos.

El 12 de junio, el gobierno estadounidense aplicó controles a las exportaciones. La orden entró en vigor de inmediato. Acceso antrópico suspendido en lugar de riesgo de incumplimiento.

El detonante fue un informe de investigadores de Amazon. Encontraron un método para eludir las salvaguardias de Fable 5. El mensaje hizo que el modelo identificara una serie de vulnerabilidades de software. En un caso, produjo un código que mostraba cómo explotar una vulnerabilidad.

El 26 de junio, el gobierno aprobó restaurar Mythos 5 para algunas organizaciones estadounidenses. El 30 de junio se levantaron totalmente los controles.

Por qué Anthropic dice que el hallazgo no fue único

Anthropic probó si el hallazgo era exclusivo de Fable 5. No lo fue.

Los modelos menos capaces identificaron las mismas vulnerabilidades. Esa lista incluye Claude Opus 4.8, GPT-5.5 y Kimi K2.7.

Para la demostración de un único exploit, todos los modelos probados lo reprodujeron. Ese conjunto incluía Haiku 4.5, Sonnet 4.6, Opus 4.6 y Opus 4.7. También cubrió Opus 4.8, GPT-5.4, GPT-5.5 y Kimi K2.7.

El equipo de Anthropic afirma que la técnica no expuso capacidades cibernéticas únicas a nivel de Mythos. Calificó el caso como límite para las salvaguardias de Fable 5. El comportamiento bloqueado implicó únicamente un trabajo rutinario de ciberseguridad defensiva.

Cómo funciona el nuevo clasificador

Anthropic todavía se movió para cerrar la brecha. Entrenó a un clasificador de seguridad mejorado para el comportamiento informado.

El clasificador bloquea la técnica específica en más del 99% de los casos. Las solicitudes bloqueadas no se rechazan por completo. En su lugar, se enrutan a Claude Opus 4.8. Los usuarios reciben una notificación cuando ocurre esta alternativa.

Investigadores del CAISI del Departamento de Comercio probaron salvaguardias nuevas y antiguas. Están de acuerdo en que las salvaguardias son extraordinariamente fuertes. La desventaja es que habrá más falsos positivos durante la codificación y depuración de rutina.

Esto refleja el diseño de “defensa en profundidad” de Anthropic. Los clasificadores son sistemas de inteligencia artificial más pequeños que detectan tareas cibernéticas dañinas. Un ‘margen de seguridad’ deliberado también bloquea algunas solicitudes benignas. Fable 5 utiliza un margen de seguridad mucho mayor que los modelos anteriores.

El marco de gravedad del jailbreak propuesto

El episodio expuso una brecha. La industria no tiene un estándar compartido para calificar un ‘jailbreak’, una técnica que elude las salvaguardas de un modelo.

Anthropic está redactando uno con Amazon, Microsoft, Google y otros socios de Glasswing. El borrador califica un jailbreak según cuatro criterios:

Ganancia de capacidad: qué tan lejos lleva al usuario más allá de las herramientas existentes. Amplitud de ganancia de capacidad: cuántas tareas ofensivas distintas desbloquea. Facilidad de armamento: cuánto esfuerzo humano aún necesita un ataque. Descubribilidad: la facilidad con la que alguien puede obtener la técnica.

Para la clase más grave, Anthropic implementará mitigaciones preliminares de inmediato. También mantiene un monitoreo las 24 horas del día, los 7 días de la semana, de los canales de envío de jailbreak.

goleador interactivo

Pruebe este marcador interactivo integrado para ver cómo se combinan estos cuatro criterios.

Casos de uso con ejemplos

Fable 5 apunta al trabajo de agencia a largo plazo. Aquí es donde los primeros ingenieros pueden aplicarlo.

Migraciones de base de código: Stripe informó una migración de toda la base de código en un día. El trabajo abarcó una base de código Ruby de 50 millones de líneas. Hacerlo a mano llevaría a un equipo más de dos meses. Análisis financiero: en el índice de referencia financiero de Hebbia, Fable 5 obtiene la puntuación más alta. Gana en razonamiento de gráficos, tablas y documentos. Visión a código: Fable 5 puede reconstruir el código fuente de una aplicación web únicamente a partir de capturas de pantalla. Agentes de larga duración: la memoria basada en archivos le ayuda a mantenerse centrado en millones de tokens.

Cómo se compara Fable 5

La pausa creó una apertura para los rivales. Días después de la suspensión, Zhipu AI lanzó GLM-5.2 como pesos abiertos. Los evaluadores independientes lo clasifican como el modelo más potente disponible en el mercado.

ModeloDesarrolladorAccesoContextoPrecio (entrada/salida por 1 millón)Parámetro de referencia informadoProtecciones cibernéticasClaude Fable 5AnthropicGeneral (Plataforma, .ai, Código, Cowork)Contexto largo$10 / $50Led AA-Maletín en 1587 EloStrongest aplicado; vuelve a Opus 4.8Claude Mythos 5AnthropicGlasswing / organizaciones confiables de EE. UU. Contexto largo$10 / $50Mismo modelo base que Fable 5Se levantaron las salvaguardias cibernéticasClaude Opus 4.8AnthropicGeneralContexto largo~$5 / $25SWE-bench Pro 69.2; Terminal-Bench 85.0EstándarGLM-5.2Zhipu AI (Z.ai)Pesos abiertos (MIT)1 millón de tokens~$1,40 / $4,40SWE-bench Pro 62.1; Terminal-Bench 81.0Ninguno (peso abierto)GPT-5.5OpenAIGeneralContexto largo~$5 / $30SWE-bench Pro 58.6Estándar

Las cifras de referencia y de precios son autoinformadas o de evaluadores independientes. Fuentes: Felloai, Latent Space, TrendingTopics.

GLM-5.2 utiliza un diseño de mezcla de expertos. Tiene aproximadamente 750 mil millones de parámetros totales. Sólo unos 40 mil millones se activan por token. En el índice de referencia IDOR de Semgrep, obtuvo una puntuación del 39% en F1. Eso superó a Claude Code con un 32% en el mismo mensaje.

La brecha se reduce en cuanto a costos. En AA-Briefcase, Fable 5 obtuvo un promedio de 31 dólares por tarea. El GLM-5.2 promedió 2,40 dólares.

Acceso y un ejemplo rápido de API

Para los planes Pro, Max, Team y Enterprise seleccionados, Fable 5 está incluido hasta el 7 de julio. Cubre hasta el 50% de los límites de uso semanal. Después de eso, el acceso pasa a los créditos de uso. Anthropic también está reactivando Fable 5 en AWS, Google Cloud y Microsoft Foundry.

Los desarrolladores llaman al modelo con la cadena claude-fable-5:

from anthropic import Anthropic # Lee su clave de la variable de entorno ANTHROPIC_API_KEY cliente = Anthropic() mensaje = client.messages.create( model=”claude-fable-5″, max_tokens=1024, mensajes=[
{“role”: “user”, “content”: “Refactor this module for readability.”}
]) imprimir(mensaje.contenido)

Si se dispara un clasificador, la respuesta proviene del Opus 4.8. La ruta de su código sigue siendo la misma.

Conclusiones clave

Fable 5 regresa el 1 de julio después de que se levantaron los controles de exportación. Un nuevo clasificador bloquea el bypass informado en más del 99% de los casos. Las solicitudes bloqueadas se dirigen al Opus 4.8, no un rechazo rotundo. Anthropic propone un marco de cuatro criterios para puntuar jailbreaks. GLM-5.2 surgió como un rival de peso abierto más barato durante la pausa.

Consulta los detalles técnicos. Además, no dude en seguirnos en Twitter y no olvide unirse a nuestro SubReddit de más de 150.000 ml y suscribirse a nuestro boletín. ¡Esperar! estas en telegrama? Ahora también puedes unirte a nosotros en Telegram.

¿Necesita asociarse con nosotros para promocionar su repositorio de GitHub O su página principal de Hugging O su lanzamiento de producto O seminario web, etc.? Conéctate con nosotros

Michal Sutter es un profesional de la ciencia de datos con una Maestría en Ciencias de Datos de la Universidad de Padua. Con una base sólida en análisis estadístico, aprendizaje automático e ingeniería de datos, Michal se destaca en transformar conjuntos de datos complejos en conocimientos prácticos.

Anthropic vuelve a implementar Claude Fable 5 el 1 de julio después del levantamiento de los controles de exportación de EE. UU. y agrega un nuevo clasificador de ciberseguridad

ByEquipo de 7 minutos

Datos breves

Qué pasó: la línea de tiempo

Por qué Anthropic dice que el hallazgo no fue único

Cómo funciona el nuevo clasificador

El marco de gravedad del jailbreak propuesto

goleador interactivo

Casos de uso con ejemplos

Cómo se compara Fable 5

Acceso y un ejemplo rápido de API

Conclusiones clave

By Equipo de 7 minutos

Related Post

¿Qué podemos hacer cuando la memoria se convierte en el nuevo cuello de botella en la ingeniería de datos?

Uso de Lift para convertir archivos PDF de investigación en JSON estructurado con evaluación a nivel de campo controlada y guiada por esquemas

MIT en los medios: Innovando y educando para los próximos 250 años de América | Noticias del MIT

You missed

Alcudia impone 200 multas por ocupar plazas de aparcamiento exclusivas para residentes

Jennifer Aniston y su novio Jim Curtis comparten fotos de las vacaciones de verano

Un análisis de sangre podría algún día detectar más de 50 tipos de cáncer: lo que eso significa para la atención del cáncer

La requisa de la conservación sigue siendo requisa