Sakana AI comercializa AB-MCTS en Sakana Marlin, un agente empresarial que genera informes de investigación de hasta 100 páginas con diapositivas

Sakana AI, con sede en Tokio, envió su primer producto comercial, ‘Sakana Marlin’, esta semana. El equipo de Sakana lo posiciona como CSO Virtual (Director de Estrategia). Es un agente de investigación autónomo B2B creado para empresas.

Marlin no responde en segundos como un chatbot. Le das un tema de investigación. Luego funciona de forma autónoma durante un máximo de ocho horas. Cada ejecución devuelve un informe extenso más una presentación de diapositivas. Sakana dice que una sola sesión genera de cientos a miles de consultas de LLM.

¿Qué es Sakana Marlín?

Marlin es un agente de investigación empresarial, no un asistente de chat. Le das un tema o pregunta. Luego planifica hipótesis, busca fuentes y verifica los hallazgos por sí solo. Comprime semanas de trabajo estratégico en horas.

El entregable está estructurado para los tomadores de decisiones. El anuncio japonés describe informes de decenas de páginas. El anuncio en inglés cita informes de hasta aproximadamente 100 páginas. En una práctica de prensa, los informes tenían entre 60 y 100 páginas y citaban entre 60 y 80 fuentes. Cada informe incluye un cuerpo principal, referencias y apéndices. Las diapositivas de presentación se generan utilizando IA de generación de imágenes.

El equipo de Sakana perfeccionó Marlin a través de una beta cerrada en abril de 2026. Alrededor de 300 profesionales lo probaron en tareas reales durante esa beta. Esas tareas abarcaron la formulación de estrategias, la investigación de mercado, el análisis de riesgos y el análisis competitivo. Sakana también se asoció con MUFG y recibió inversiones estratégicas de Citigroup.

Dentro de AB-MCTS: más ancho o más profundo

La columna vertebral de Marlin es AB-MCTS, o Búsqueda de árboles de Monte Carlo con ramificación adaptativa. Proviene de una investigación anterior de Sakana “¿Más amplio o más profundo? Escalamiento de la computación en tiempo de inferencia del LLM con búsqueda adaptativa de árboles ramificados”.

AB-MCTS trata el razonamiento como un problema de búsqueda de árboles. En cada paso, el algoritmo toma una decisión. Puede ampliarse generando una nueva respuesta candidata. O puede ir más allá refinando una respuesta prometedora existente. El muestreo repetido estándar sólo se amplía en paralelo, luego se espera que una respuesta sea correcta.

Una variante multi-LLM agrega una segunda opción. Puede enrutar un paso a un modelo completamente diferente. En los experimentos ARC-AGI-2 informados por Sakana, esta colaboración ayudó. La combinación de o4-mini, Gemini 2.5 Pro y DeepSeek-R1 resolvió aproximadamente el 27,5% de las tareas. El modelo o4-mini por sí solo resolvió alrededor del 23%. Marlin aplica la misma búsqueda adaptativa a la investigación a largo plazo.

El segundo componente clave para Marlin es la automatización del flujo de trabajo del proyecto AI Scientist de Sakana. Ese proyecto demostró un descubrimiento científico autónomo y fue publicado en Nature.

Demostración interactiva: el widget integrable (marlin-abmcts-demo.html) muestra en vivo la decisión “más amplia o más profunda”. Pulsa Ejecutar y observa cómo crece el árbol. Los nodos más verdes obtienen puntuaciones más altas y se resalta el mejor camino. Cambie a “Multi-LLM” para ver los pasos enrutados entre diferentes modelos.

AB-MCTS: “¿Más amplio o más profundo?” — búsqueda interactiva

Una imagen simplificada de la búsqueda de árboles Monte Carlo con ramificación adaptativa de Sakana AI. En cada paso la política opta por ampliar (nuevo candidato) o profundizar (refinar una línea prometedora).

Estado de búsqueda

Presupuesto utilizado0 / 24

Nodos (candidatos)1

Mejor puntuación0.00

Más ancho/más profundo0 / 0

puntuación baja
puntuación alta
mejor camino

Cómo se compara Marlin

Marlin compite en profundidad, no en velocidad. Las herramientas convencionales de investigación profunda responden en minutos o decenas de minutos. Marlin dedica deliberadamente horas a mejorar la calidad de la producción. Los tiempos de ejecución de los competidores a continuación son aproximados y reportados, no cifras oficiales.

HerramientaTiempo de ejecución típicoSalidaUsuario principalSakana MarlinHasta ~8 horasInforme (de docenas a ~100 páginas) + diapositivasEquipos de estrategia empresarialOpenAI Deep Research~Minutos a decenas de minutosInforme de texto citadoUsuarios generales y profesionalesPerplexity Deep Research~Unos minutosRespuesta de texto citadoUsuarios generalesGoogle Gemini Deep Research~MinutosInforme de texto citadoUsuarios generales y del espacio de trabajo

La compensación es explícita. Espera más y paga por ejecución. A cambio, obtienes pruebas de hipótesis más profundas y un resultado final. Puedes cancelar una ejecución en cualquier momento, pero los créditos aún se consumen.

Precios

Sakana ofrece pago por uso junto con los niveles Pro, Team y Enterprise. El pago por uso comienza en 100 créditos por ejecución, a 98 yenes por crédito. Pro cuesta ¥ 150.000 por mes e incluye 2.000 créditos. El equipo cuesta ¥ 400.000 por mes e incluye 6.000 créditos. Los precios empresariales son personalizados, con soporte dedicado.

Casos de uso, con ejemplos

Marlin se adapta a cuestiones de alto riesgo donde la investigación es el cuello de botella. A continuación se muestran ejemplos concretos extraídos de sus tareas objetivo.

Entrada al mercado: ‘Evaluar el mercado de pagos tokenizados y monedas estables de Japón después del cambio regulatorio’. Marlin asigna factores, riesgos y opciones estructuradas en un informe. Análisis de riesgos: ‘Modelos de escenarios de resolución para un bloqueo del Estrecho de Ormuz’. Compara hipótesis, no sólo resúmenes, antes de sacar conclusiones. Análisis competitivo: Perfilar tres rivales y jerarquizar nuestras brechas de posicionamiento. Devuelve diapositivas listas para una revisión de la estrategia.

Cada ejemplo se ajusta a un mensaje y a una ejecución desatendida. Un humano todavía revisa el resultado citado antes de tomar cualquier decisión.

Pruebe el motor usted mismo: TreeQuest

No puedes hospedar a Marlin por tu cuenta. Pero puedes ejecutar su algoritmo central hoy. AB-MCTS de código abierto de Sakana como TreeQuest bajo la licencia Apache 2.0. Instálelo, defina una función de generación y luego ejecute un presupuesto de búsqueda fijo.

import random import treequest as tq # Cada nodo mantiene un estado definido por el usuario; La puntuación debe normalizarse a [0, 1]. def generar(parent_state): si parent_state es Ninguno: # Ninguno significa expandir desde la raíz new_state = “Borrador inicial” else: new_state = f”Refined: {parent_state}” puntaje = random.random() # intercambiar esto por un retorno de puntaje basado en LLM new_state, puntaje algo = tq.ABMCTSA() # MCTS de ramificación adaptable (variante A) search_tree = algo.init_tree() for _ in range(10): # presupuesto de generación de 10 árbol_búsqueda = algo.step(árbol_búsqueda, {“generar”: generar}) mejor_estado, mejor_puntuación = tq.top_k(árbol_búsqueda, algo, k=1)[0]
print(“MEJOR:”, mejor_estado, ronda(mejor_puntuación, 3))

Cambie la puntuación aleatoria por un juez de LLM para reproducir el patrón real. TreeQuest también ofrece búsqueda y puntos de control de múltiples LLM para tiradas largas. Los puntos de control son importantes porque las sesiones largas pueden generar errores de API a mitad de camino.

Fortalezas y debilidades

Fortalezas

Fundaciones revisadas por pares: AB-MCTS en NeurIPS y AI Scientist in Nature. Entregables terminados, incluidas referencias, apéndices y diapositivas. La computación adaptativa dedica esfuerzos a las ramas más prometedoras. El núcleo de código abierto (TreeQuest) permite a los investigadores de IA estudiar el método.

Debilidades

Los tiempos de ejecución prolongados hacen que la iteración sea lenta en comparación con las herramientas de investigación de escala diminuta. Los informes automatizados pueden contener errores difíciles de detectar que requieren revisión humana. La fijación de precios y el diseño están dirigidas a empresas, no a desarrolladores individuales. El propio Marlin está cerrado; sólo el algoritmo subyacente está abierto.

Conclusiones clave

Sakana Marlin realiza investigaciones autónomas durante hasta ocho horas por tarea. Una ejecución produce un informe de docenas de páginas, además de diapositivas. Se basa en los flujos de trabajo AB-MCTS (NeurIPS 2025 Spotlight) y AI Scientist (Nature). El precio de entrada es de pago por uso: 100 créditos por ejecución a 98 yenes por crédito. Está dirigido a equipos de finanzas, estrategia corporativa, consultoría y think tanks.

Fuentes

Sakana AI — Lanzamiento de Sakana Marlin: https://sakana.ai/marlin-release/ Sakana AI — Página del producto Sakana Marlin: https://sakana.ai/marlin/ Sakana AI — Investigación AB-MCTS y TreeQuest: https://sakana.ai/ab-mcts/ SakanaAI/treequest (GitHub, Apache 2.0): https://github.com/SakanaAI/treequest

Sakana AI comercializa AB-MCTS en Sakana Marlin, un agente empresarial que genera informes de investigación de hasta 100 páginas con diapositivas

ByEquipo de 7 minutos

¿Qué es Sakana Marlín?

Dentro de AB-MCTS: más ancho o más profundo

AB-MCTS: “¿Más amplio o más profundo?” — búsqueda interactiva

Estado de búsqueda

Cómo se compara Marlin

Precios

Casos de uso, con ejemplos

Pruebe el motor usted mismo: TreeQuest

Fortalezas y debilidades

Fortalezas

Debilidades

Conclusiones clave

Fuentes

By Equipo de 7 minutos

Related Post

El protocolo que limpió la arquitectura de nuestros agentes

Cómo alinearse eficazmente con el Código Claude

Conozca Flash-KMeans: un K-Means exacto y compatible con IO que se ejecuta más de 200 veces más rápido que FAISS en GPU

You missed

Bestie Bite, la startup italiana de HospitalityTech fundada por una mujer, recauda 1,5 millones de euros para expandir su aplicación de reseñas de videos en los EE. UU.

El Ayuntamiento de Torrevieja destina 35.000€ para apoyar eventos deportivos en 2026 – The Leader

La estrella de UFC Josh Hokit llama a Michelle Obama “hombre” en la Casa Blanca

Astrobotic presenta el módulo de aterrizaje lunar Griffin-1 para la misión de la base lunar de la NASA