Kosmos, construido por Edison Scientific, es un sistema de descubrimiento autónomo que ejecuta largas campañas de investigación con un único objetivo. Dado un conjunto de datos y un objetivo de lenguaje natural abierto, realiza ciclos repetidos de análisis de datos, búsqueda de literatura y generación de hipótesis, luego sintetiza los resultados en un informe científico completamente citado. Una ejecución típica dura hasta 12 horas, incluye alrededor de 200 implementaciones de agentes, ejecuta alrededor de 42.000 líneas de código y lee alrededor de 1.500 artículos.
Arquitectura, modelo mundial y roles de agentes.
La elección de diseño central es un modelo mundial estructurado que actúa como memoria a largo plazo para el sistema. El modelo mundial es una base de datos de entidades, relaciones, resultados experimentales y preguntas abiertas que se actualiza después de cada tarea. A diferencia de una ventana de contexto simple, se puede consultar y está estructurada, por lo que la información de los primeros pasos sigue siendo accesible después de decenas de miles de tokens.
Kosmos utiliza dos agentes principales, un agente de análisis de datos y un agente de búsqueda de literatura. Cada ciclo, el sistema propone hasta 10 tareas concretas en función del objetivo de la investigación y del modelo mundial actual. Los ejemplos incluyen realizar un análisis de abundancia diferencial en un conjunto de datos metabolómicos o buscar vías que conecten un gen candidato con un fenotipo de enfermedad. Los agentes escriben código, lo ejecutan en un entorno de cuaderno o recuperan y leen artículos, luego escriben resultados estructurados y citas en el modelo mundial.
Este bucle se repite durante muchos ciclos. Al final de la ejecución, un componente de síntesis separado atraviesa el modelo mundial y emite un informe donde cada declaración está vinculada a una celda del cuaderno Jupyter o a un pasaje específico de la literatura primaria. Esta procedencia explícita es importante en entornos científicos porque permite a los colaboradores humanos auditar reclamaciones individuales en lugar de tratar el sistema como una caja negra.
Equivalencia de precisión y tiempo de investigación.
El equipo evalúa la calidad del informe tomando muestras de 102 afirmaciones de 3 informes representativos de Kosmos y pidiendo a expertos en el dominio que clasifiquen cada afirmación como respaldada o refutada. En general, el 79,4 por ciento de las declaraciones se consideran precisas. Las declaraciones de análisis de datos son las más confiables en aproximadamente el 85,5 por ciento, las declaraciones bibliográficas son correctas aproximadamente el 82,1 por ciento de las veces y las declaraciones de síntesis que combinan evidencia son correctas aproximadamente el 57,9 por ciento de las veces.
Para estimar el esfuerzo humano equivalente, los autores suponen 2 horas para una trayectoria típica de análisis de datos y 15 minutos para leer un artículo, luego cuentan las trayectorias y los artículos por ejecución. Esto produce aproximadamente 4,1 meses de trabajo para una carrera típica, suponiendo una semana laboral de 40 horas. En una encuesta separada, siete científicos colaboradores calificaron una ejecución de Kosmos de 20 pasos como equivalente a aproximadamente 6,14 meses de su propio trabajo en el mismo objetivo, y este esfuerzo percibido aumenta aproximadamente de manera lineal con el número de ciclos hasta 20.
Descubrimientos representativos
Kosmos se prueba en 7 estudios de casos que abarcan la metabolómica, la ciencia de los materiales, la neurociencia, la genética estadística y la neurodegeneración. En 3 casos, reproduce de forma independiente resultados humanos anteriores sin acceder a las preimpresiones originales durante la ejecución. En 4 casos, propone mecanismos que los autores describen como contribuciones novedosas a la literatura.
En el primer descubrimiento, Kosmos analiza datos metabolómicos de un experimento de hipotermia en ratones. Identifica el metabolismo de los nucleótidos como la vía alterada dominante en los cerebros hipotérmicos, con una disminución de las bases precursoras y los nucleósidos y un aumento de los productos monofosfato. El sistema concluye que las vías de recuperación de nucleótidos dominan sobre la síntesis de novo durante la hipotermia protectora, lo que coincide con un análisis humano independiente que no estaba publicado en el momento de la ejecución.
En el segundo descubrimiento, Kosmos analiza los registros ambientales de un sistema de fabricación de células solares de perovskita. Recupera el resultado humano de que la humedad absoluta durante el recocido térmico es el principal determinante de la eficiencia del dispositivo e identifica un umbral de humedad crítico descrito como un filtro fatal, más allá del cual los dispositivos fallan. Este hallazgo coincide con una preimpresión en ciencia de materiales a la que Kosmos no pudo acceder en tiempo de ejecución debido a cortes de entrenamiento del modelo y restricciones de recuperación.
En el tercer descubrimiento, Kosmos recibe reconstrucciones a nivel de neuronas en varias especies y ajusta distribuciones para la longitud, el grado y el recuento de sinapsis de las neuritas. Concluye que las distribuciones de grados y sinapsis se modelan mejor como log normal que sin escala y recupera la escala de la ley de potencia entre la longitud de las neuritas y el recuento de sinapsis en la mayoría de los conjuntos de datos. Estos resultados se alinean con las reglas de conectividad informadas en una preimpresión anterior de neurociencia.
Los cuatro descubrimientos restantes se describen como novedosos. Incluyen un análisis de aleatorización mendeliano que implica a la superóxido dismutasa 2 circulante como un factor protector para la fibrosis miocárdica, la definición de una puntuación de clasificación mecanística que integra probabilidades de inclusión posterior y evidencia multiómica para loci de diabetes tipo 2, un análisis proteómico que ordena eventos moleculares a lo largo de un eje pseudotemporal en la enfermedad de Alzheimer y un análisis transcriptómico de núcleo único a gran escala que vincula la pérdida de expresión de flippasa relacionada con la edad y la exposición a fosfatidilserina. señales a la vulnerabilidad de las neuronas de la corteza entorrinal.
Conclusiones clave
Kosmos es un científico de IA autónomo que trabaja hasta 12 horas por objetivo, ejecuta alrededor de 42.000 líneas de código y lee alrededor de 1.500 artículos por ejecución, coordinados a través de un modelo mundial estructurado. El sistema utiliza agentes de búsqueda de literatura y análisis de datos paralelos que comparten un modelo mundial central, lo que permite a Kosmos mantener un razonamiento coherente a largo plazo en aproximadamente 200 implementaciones de agentes. Los evaluadores expertos encontraron que el 79,4 por ciento de las declaraciones de los informes muestreados eran precisas, con análisis de datos y declaraciones de literatura superiores al 80 por ciento de precisión, mientras que las declaraciones de interpretación siguen siendo menos confiables. Los colaboradores califican una ejecución de Kosmos de 20 ciclos como equivalente a aproximadamente 6 meses de esfuerzo de investigación experto, y la cantidad de hallazgos valiosos aumenta aproximadamente linealmente con el recuento de ciclos hasta 20. A través de 7 estudios de caso en metabolómica, ciencia de materiales, neurociencia, genética estadística y neurodegeneración, Kosmos reproduce resultados inéditos o posteriores al corte y propone mecanismos novedosos, al tiempo que sigue requiriendo científicos humanos para la selección y validación del conjunto de datos.
Kosmos muestra lo que sucede cuando un modelo mundial estructurado y agentes Edison independientes del dominio son llevados a los límites de las herramientas LLM actuales; ofrece ganancias mensurables en profundidad de razonamiento, reproducibilidad y trazabilidad, sin dejar de depender de los científicos para la curación de datos, el establecimiento de objetivos y la interpretación de declaraciones de síntesis que siguen siendo menos confiables que el análisis de datos y las declaraciones de la literatura. En general, Kosmos es un modelo sólido para la ciencia acelerada por la IA, no un reemplazo para los investigadores humanos.
Consulte el documento y los detalles técnicos. No dude en consultar nuestra página de GitHub para tutoriales, códigos y cuadernos. Además, no dude en seguirnos en Twitter y no olvide unirse a nuestro SubReddit de más de 100.000 ML y suscribirse a nuestro boletín. ¡Esperar! estas en telegrama? Ahora también puedes unirte a nosotros en Telegram.

Michal Sutter es un profesional de la ciencia de datos con una Maestría en Ciencias de Datos de la Universidad de Padua. Con una base sólida en análisis estadístico, aprendizaje automático e ingeniería de datos, Michal se destaca en transformar conjuntos de datos complejos en conocimientos prácticos.
🙌 Siga MARKTECHPOST: agréguenos como fuente preferida en Google.