Anthropic lanzó dos modelos el 9 de junio de 2026: Claude Fable 5 y Claude Mythos 5. Ambos pertenecen a un nivel llamado “clase Mythos”. Este nivel se encuentra por encima de la clase Opus en capacidad. Fable 5 es la versión que se dice que es segura para uso general. Mythos 5 es el mismo modelo con algunas salvaguardas eliminadas y mantenido en versión limitada.
Claude Fábula 5 y Mitos 5
Los modelos de clase Mythos son un nivel de modelos de Claude. Se sitúan por encima de la clase Opus en cuanto a capacidad. El primero fue Claude Mythos Preview, lanzado en abril a través del Proyecto Glasswing.
Fable 5 y Mythos 5 comparten el mismo modelo subyacente. La diferencia son las salvaguardias. Fable 5 se envía con clasificadores de seguridad para uso general. A Mythos 5 se le han eliminado algunos clasificadores y permanece en versión limitada.
Los nombres reflejan esta división. “Fábula” proviene del latín fabula, “lo que se cuenta”. Esto es similar al mito griego. Las salvaguardias distinguen los dos modelos, por lo que llevan nombres diferentes.
El equipo de Anthropic considera que Fable 5 es su modelo más capaz y ampliamente lanzado. Se centra en el razonamiento exigente y el trabajo de agencia a largo plazo. Anthropic afirma que las capacidades de Fable 5 superan cualquier modelo que haya puesto a disposición del público.
Ambos modelos admiten una ventana de contexto de token de 1 millón de forma predeterminada. Permiten hasta 128.000 tokens de salida por solicitud. El precio es de 10 dólares por millón de tokens de entrada y 50 dólares por millón de tokens de salida. Eso es menos de la mitad del precio de Claude Mythos Preview.
El caso de la capacidad
Anthropic informa que Fable 5 es lo último en casi todos los puntos de referencia de capacidad probados. Muestra sólidos resultados en ingeniería de software, trabajo del conocimiento, visión e investigación científica. Cuanto más larga y compleja sea la tarea, mayor será su ventaja sobre los otros modelos de Anthropic.
En ingeniería de software, Stripe probó Fable 5 durante el acceso anticipado. El modelo realizó una migración de todo el código base en un código base Ruby de 50 millones de líneas. Según Stripe: esto tomó un día. A mano, un equipo habría necesitado más de dos meses.
Fable 5 también es más eficiente en cuanto a tokens que los modelos anteriores de Claude. En la evaluación FrontierCode de Cognition, Fable 5 obtiene la puntuación más alta entre los modelos fronterizos. Esto se mantiene incluso con un esfuerzo medio. La evaluación prueba tareas de codificación difíciles según los estándares de base de código de producción.
En cuanto al trabajo del conocimiento, Anthropic cita el Finance Benchmark de Hebbia para un razonamiento de alto nivel. Fable 5 publica la puntuación más alta de todos los modelos allí. Los beneficios se obtienen en el razonamiento basado en documentos, la interpretación de gráficos y tablas y la resolución de problemas.
En cuanto a la visión, Anthropic llama a Fable 5 el nuevo estado del arte. Puede extraer números precisos de cifras científicas detalladas. Puede reconstruir el código fuente de una aplicación web únicamente a partir de capturas de pantalla. También necesita menos andamios que los modelos anteriores. Fable 5 venció a Pokémon Rojo Fuego con un arnés mínimo de solo visión.
En cuanto a la memoria y el contexto a largo plazo, Fable 5 se mantiene centrado en millones de tokens. Mejora sus resultados utilizando sus propias notas. En el juego Slay the Spire, la memoria persistente basada en archivos ayudó tres veces más que Opus 4.8.
Mythos 5 lleva las afirmaciones científicas. Los expertos en diseño de proteínas internas aceleraron partes del diseño de fármacos unas diez veces. Anthropic también dice que Mythos 5 es su primer modelo que produce constantemente hipótesis científicas novedosas. Los científicos prefirieron sus hipótesis de biología molecular alrededor del 80% de las veces en comparaciones ciegas.
Mythos 5 también llevó a cabo investigaciones genómicas novedosas durante una semana de trabajo en gran medida autónomo. Entrenó un modelo personalizado con datos unicelulares que abarcan 138 especies animales. Anthropic dice que ese modelo superó a un modelo reciente publicado en Science, a pesar de ser 100 veces más pequeño.
Cómo funcionan las salvaguardias
Lanzar un modelo con esta capacidad conlleva riesgos. Sin salvaguardias, las capacidades de ciberseguridad de Fable 5 podrían usarse indebidamente y causar daños graves. Por lo tanto, Anthropic lanzó Fable 5 con un nuevo conjunto de clasificadores.
Los clasificadores son sistemas de IA separados. Detectan posibles usos indebidos, incluidos intentos de jailbreak. Impiden que el modelo principal responda a las solicitudes marcadas.
Cuando los clasificadores de Fable 5 marcan una solicitud, la respuesta es manejada por Claude Opus 4.8. Las áreas cubiertas son ciberseguridad, biología y química, y destilación. Los usuarios son informados cada vez que se produce un retroceso.
Para biología y química, Fable 5 recurre a Opus 4.8 en la mayoría de las solicitudes por ahora. Anthropic teme que las mismas consultas de doble uso puedan animar a actores maliciosos. Planea un programa de acceso confiable para la biología, brindando a los investigadores aprobados Fable 5 sin esas salvaguardas.
Anthropic ajustó estas salvaguardas de manera conservadora. A veces captarán solicitudes inofensivas. En promedio, se activan en menos del 5% de las sesiones. Anthropic dice que más del 95% de las sesiones de Fable no implican ningún respaldo. Para esas sesiones, el rendimiento de Fable 5 coincide efectivamente con el de Mythos 5.
El rojo antrópico formó un equipo extenso con los clasificadores. Una recompensa por errores externos no produjo fugas universales en más de 1000 horas. Un jailbreak universal permite al usuario interactuar con el modelo como si sus protecciones estuvieran ausentes. Anthropic señala que el AISI del Reino Unido avanzó hacia uno en una breve ventana de prueba.
Mythos 5 es el mismo modelo con las salvaguardas cibernéticas eliminadas. Anthropic lo describe como el que tiene las capacidades de ciberseguridad más sólidas de cualquier modelo actual. Se implementa a través del Proyecto Glasswing en colaboración con el gobierno de EE. UU.
Casos de uso
Estas capacidades se asignan a varios flujos de trabajo concretos para los equipos técnicos:
Migración de código a gran escala: la codificación a largo plazo se adapta a grandes refactores y migraciones entre repositorios. El ejemplo de Stripe muestra esto en una escala de 50 millones de líneas. Canalizaciones de codificación agente: menos turnos y eficiencia de token ayudan a las ejecuciones de agentes en varios pasos. GitHub informó autonomía y confiabilidad en tareas de codificación complejas y de largo plazo. Trabajo de finanzas y análisis: un sólido razonamiento en documentos y gráficos se adapta al análisis financiero de alto nivel. Hebbia e IMC citaron avances en tareas de razonamiento y análisis comercial. Tareas de visión a código: la reconstrucción del código fuente a partir de capturas de pantalla se adapta a la reconstrucción frontal y la extracción de figuras. El arnés de solo visión reduce la sobrecarga de herramientas. Agentes de investigación de larga duración: la memoria persistente en millones de tokens se adapta a ciclos de investigación de varios días. Mythos 5 realizó trabajos genómicos novedosos durante una semana de trabajo en gran medida autónomo.
Tabla comparativa: Fable 5 vs. Mythos 5 vs. Opus 4.8
Nota: Las especificaciones y precios específicos de Opus 4.8 no se detallan en las fuentes de lanzamiento de Fable 5. La tabla marca esas celdas en consecuencia.
Conclusiones clave
Fable 5 y Mythos 5 comparten un modelo subyacente; las salvaguardias son la única diferencia. Anthropic informa que Fable 5 es lo último en casi todos los puntos de referencia de capacidad probados. Los clasificadores de Fable 5 vuelven a Opus 4.8 y se activan en menos del 5% de las sesiones. Ambos modelos ofrecen una ventana de contexto de tokens de 1 millón con una entrada de $10 y una salida de $50 por millón de tokens. Mythos 5 permanece limitado al Proyecto Glasswing; Fable 5 generalmente está disponible en las principales plataformas.
Todo Twitter HN LinkedIn
Cualquier estado de ánimo Positivo Neutral Negativo
Sentimiento de alcance del tema del autor/publicación principal
Consulte los detalles técnicos, los documentos y el análisis de sentimientos de la comunidad de IA. Además, no dude en seguirnos en Twitter y no olvide unirse a nuestro SubReddit de más de 150.000 ML y suscribirse a nuestro boletín. ¡Esperar! estas en telegrama? Ahora también puedes unirte a nosotros en Telegram.
¿Necesita asociarse con nosotros para promocionar su repositorio de GitHub O su página principal de Hugging O su lanzamiento de producto O seminario web, etc.? Conéctate con nosotros