Sakana AI, con sede en Tokio, envió su primer producto comercial, ‘Sakana Marlin’, esta semana. El equipo de Sakana lo posiciona como CSO Virtual (Director de Estrategia). Es un agente de investigación autónomo B2B creado para empresas.
Marlin no responde en segundos como un chatbot. Le das un tema de investigación. Luego funciona de forma autónoma durante un máximo de ocho horas. Cada ejecución devuelve un informe extenso más una presentación de diapositivas. Sakana dice que una sola sesión genera de cientos a miles de consultas de LLM.
¿Qué es Sakana Marlín?
Marlin es un agente de investigación empresarial, no un asistente de chat. Le das un tema o pregunta. Luego planifica hipótesis, busca fuentes y verifica los hallazgos por sí solo. Comprime semanas de trabajo estratégico en horas.
El entregable está estructurado para los tomadores de decisiones. El anuncio japonés describe informes de decenas de páginas. El anuncio en inglés cita informes de hasta aproximadamente 100 páginas. En una práctica de prensa, los informes tenían entre 60 y 100 páginas y citaban entre 60 y 80 fuentes. Cada informe incluye un cuerpo principal, referencias y apéndices. Las diapositivas de presentación se generan utilizando IA de generación de imágenes.
El equipo de Sakana perfeccionó Marlin a través de una beta cerrada en abril de 2026. Alrededor de 300 profesionales lo probaron en tareas reales durante esa beta. Esas tareas abarcaron la formulación de estrategias, la investigación de mercado, el análisis de riesgos y el análisis competitivo. Sakana también se asoció con MUFG y recibió inversiones estratégicas de Citigroup.
Dentro de AB-MCTS: más ancho o más profundo
La columna vertebral de Marlin es AB-MCTS, o Búsqueda de árboles de Monte Carlo con ramificación adaptativa. Proviene de una investigación anterior de Sakana “¿Más amplio o más profundo? Escalamiento de la computación en tiempo de inferencia del LLM con búsqueda adaptativa de árboles ramificados”.
AB-MCTS trata el razonamiento como un problema de búsqueda de árboles. En cada paso, el algoritmo toma una decisión. Puede ampliarse generando una nueva respuesta candidata. O puede ir más allá refinando una respuesta prometedora existente. El muestreo repetido estándar sólo se amplía en paralelo, luego se espera que una respuesta sea correcta.
Una variante multi-LLM agrega una segunda opción. Puede enrutar un paso a un modelo completamente diferente. En los experimentos ARC-AGI-2 informados por Sakana, esta colaboración ayudó. La combinación de o4-mini, Gemini 2.5 Pro y DeepSeek-R1 resolvió aproximadamente el 27,5% de las tareas. El modelo o4-mini por sí solo resolvió alrededor del 23%. Marlin aplica la misma búsqueda adaptativa a la investigación a largo plazo.
El segundo componente clave para Marlin es la automatización del flujo de trabajo del proyecto AI Scientist de Sakana. Ese proyecto demostró un descubrimiento científico autónomo y fue publicado en Nature.
Demostración interactiva: el widget integrable (marlin-abmcts-demo.html) muestra en vivo la decisión “más amplia o más profunda”. Pulsa Ejecutar y observa cómo crece el árbol. Los nodos más verdes obtienen puntuaciones más altas y se resalta el mejor camino. Cambie a “Multi-LLM” para ver los pasos enrutados entre diferentes modelos.
AB-MCTS: “¿Más amplio o más profundo?” — búsqueda interactiva
Una imagen simplificada de la búsqueda de árboles Monte Carlo con ramificación adaptativa de Sakana AI. En cada paso la política opta por ampliar (nuevo candidato) o profundizar (refinar una línea prometedora).
Estado de búsqueda
Presupuesto utilizado0 / 24
Nodos (candidatos)1
Mejor puntuación0.00
Más ancho/más profundo0 / 0
puntuación baja
puntuación alta
mejor camino
Cómo se compara Marlin
Marlin compite en profundidad, no en velocidad. Las herramientas convencionales de investigación profunda responden en minutos o decenas de minutos. Marlin dedica deliberadamente horas a mejorar la calidad de la producción. Los tiempos de ejecución de los competidores a continuación son aproximados y reportados, no cifras oficiales.
La compensación es explícita. Espera más y paga por ejecución. A cambio, obtienes pruebas de hipótesis más profundas y un resultado final. Puedes cancelar una ejecución en cualquier momento, pero los créditos aún se consumen.
Precios
Sakana ofrece pago por uso junto con los niveles Pro, Team y Enterprise. El pago por uso comienza en 100 créditos por ejecución, a 98 yenes por crédito. Pro cuesta ¥ 150.000 por mes e incluye 2.000 créditos. El equipo cuesta ¥ 400.000 por mes e incluye 6.000 créditos. Los precios empresariales son personalizados, con soporte dedicado.
Casos de uso, con ejemplos
Marlin se adapta a cuestiones de alto riesgo donde la investigación es el cuello de botella. A continuación se muestran ejemplos concretos extraídos de sus tareas objetivo.
Entrada al mercado: ‘Evaluar el mercado de pagos tokenizados y monedas estables de Japón después del cambio regulatorio’. Marlin asigna factores, riesgos y opciones estructuradas en un informe. Análisis de riesgos: ‘Modelos de escenarios de resolución para un bloqueo del Estrecho de Ormuz’. Compara hipótesis, no sólo resúmenes, antes de sacar conclusiones. Análisis competitivo: Perfilar tres rivales y jerarquizar nuestras brechas de posicionamiento. Devuelve diapositivas listas para una revisión de la estrategia.
Cada ejemplo se ajusta a un mensaje y a una ejecución desatendida. Un humano todavía revisa el resultado citado antes de tomar cualquier decisión.
Pruebe el motor usted mismo: TreeQuest
No puedes hospedar a Marlin por tu cuenta. Pero puedes ejecutar su algoritmo central hoy. AB-MCTS de código abierto de Sakana como TreeQuest bajo la licencia Apache 2.0. Instálelo, defina una función de generación y luego ejecute un presupuesto de búsqueda fijo.
print(“MEJOR:”, mejor_estado, ronda(mejor_puntuación, 3))
Cambie la puntuación aleatoria por un juez de LLM para reproducir el patrón real. TreeQuest también ofrece búsqueda y puntos de control de múltiples LLM para tiradas largas. Los puntos de control son importantes porque las sesiones largas pueden generar errores de API a mitad de camino.
Fortalezas y debilidades
Fortalezas
Fundaciones revisadas por pares: AB-MCTS en NeurIPS y AI Scientist in Nature. Entregables terminados, incluidas referencias, apéndices y diapositivas. La computación adaptativa dedica esfuerzos a las ramas más prometedoras. El núcleo de código abierto (TreeQuest) permite a los investigadores de IA estudiar el método.
Debilidades
Los tiempos de ejecución prolongados hacen que la iteración sea lenta en comparación con las herramientas de investigación de escala diminuta. Los informes automatizados pueden contener errores difíciles de detectar que requieren revisión humana. La fijación de precios y el diseño están dirigidas a empresas, no a desarrolladores individuales. El propio Marlin está cerrado; sólo el algoritmo subyacente está abierto.
Conclusiones clave
Sakana Marlin realiza investigaciones autónomas durante hasta ocho horas por tarea. Una ejecución produce un informe de docenas de páginas, además de diapositivas. Se basa en los flujos de trabajo AB-MCTS (NeurIPS 2025 Spotlight) y AI Scientist (Nature). El precio de entrada es de pago por uso: 100 créditos por ejecución a 98 yenes por crédito. Está dirigido a equipos de finanzas, estrategia corporativa, consultoría y think tanks.
Fuentes
Sakana AI — Lanzamiento de Sakana Marlin: https://sakana.ai/marlin-release/ Sakana AI — Página del producto Sakana Marlin: https://sakana.ai/marlin/ Sakana AI — Investigación AB-MCTS y TreeQuest: https://sakana.ai/ab-mcts/ SakanaAI/treequest (GitHub, Apache 2.0): https://github.com/SakanaAI/treequest