¿Qué pasa si la industria de la IA está optimizando para lograr un objetivo que no se puede definir claramente ni medir de manera confiable? Ese es el argumento central de un nuevo artículo de Yann LeCun y su equipo, que afirma que la Inteligencia General Artificial se ha convertido en un término sobrecargado utilizado de manera inconsistente en la academia y la industria. El equipo de investigación argumentó que debido a que AGI carece de una definición operativa estable, se ha convertido en un objetivo científico débil para evaluar el progreso o guiar la investigación.
Por qué la inteligencia humana no es verdaderamente “general”
El equipo de investigación del artículo comienza cuestionando una suposición común detrás de muchas discusiones sobre AGI: que la inteligencia humana es un modelo significativo para la inteligencia “general”. El equipo de investigación sostiene que los humanos sólo parecen generales porque evaluamos la inteligencia desde dentro de la distribución de tareas determinada por la biología y la supervivencia humanas. Somos buenos en el tipo de tareas que importan para nuestra existencia, como la percepción, el control motor, la planificación y el razonamiento social. Pero fuera de ese rango, la capacidad humana es limitada y, en muchos casos, las máquinas ya nos superan. El punto del artículo de investigación no es que los humanos sean limitados en todos los sentidos, sino que la inteligencia humana se entiende mejor como especializada y adaptable que como general en un sentido universal.
El problema con las definiciones de AGI centradas en el ser humano
Esa distinción es importante porque muchas definiciones de AGI heredan silenciosamente un punto de referencia centrado en el ser humano. El equipo de investigación sostiene que no existe un consenso real sobre lo que significa AGI en el mundo académico o industrial. Algunas definiciones se centran en hacer todo lo que un ser humano puede hacer. Otros se centran en la utilidad económica, la competencia amplia para realizar tareas, el razonamiento abierto o la capacidad de aprender. Estas no son definiciones equivalentes y no producen un objetivo de evaluación claro. Por lo tanto, el equipo de investigación sostiene que las definiciones de AGI existentes son insuficientes porque a menudo son ambiguas, difíciles de evaluar o no verdaderamente generales una vez examinadas de cerca.
El cambio de AGI a SAI
La alternativa del artículo de investigación es la Inteligencia Adaptable Sobrehumana, o SAI. Define a la SAI como inteligencia que puede adaptarse para superar a los humanos en cualquier tarea que los humanos puedan realizar, al mismo tiempo que se adapta a tareas útiles fuera del dominio humano. Se trata de un cambio sutil pero importante. En lugar de preguntar si un sistema ya empareja a los humanos en una lista fija de tareas, el equipo de investigación se pregunta con qué rapidez el sistema puede aprender algo nuevo y en qué medida puede seguir adaptándose. En este marco, la métrica clave es la velocidad de adaptación: la velocidad con la que un agente adquiere nuevas habilidades y aprende nuevas tareas.
Por qué la velocidad de adaptación es más importante que los puntos de referencia estáticos
Esto reformula el problema de una manera más amigable para la ingeniería. Un punto de referencia basado en un catálogo cada vez mayor de tareas se vuelve confuso rápidamente; el espacio de posibles habilidades es efectivamente ilimitado. El equipo de investigación argumentó que evaluar la inteligencia como un inventario estático de competencias es una abstracción equivocada. Lo que más importa es si un sistema puede especializarse rápidamente cuando encuentra un nuevo dominio, un nuevo objetivo o un nuevo entorno. Es por eso que el trabajo de investigación trata la adaptabilidad, más que la generalidad, como la mejor Estrella Polar.
La especialización como característica, no como fracaso
Una segunda afirmación importante del artículo de investigación es que el progreso de la IA no debe enmarcarse como una marcha hacia un modelo universal que haga todo igualmente bien. El equipo de investigación argumentó que la especialización no es una debilidad de la inteligencia sino una ruta práctica hacia un alto desempeño. Los humanos mismos no son un contraejemplo; son parte de la evidencia. El artículo de investigación sugiere que los futuros sistemas de IA probablemente necesitarán especialización interna, jerarquía y diversidad en todos los modelos y modalidades, en lugar de un único sistema monolítico. En términos sencillos, el artículo de investigación sostiene que no se debe esperar que un modelo domine todos los dominios con la misma eficiencia sólo porque al lenguaje de marketing actual le gusta la palabra “general”.
¿Por qué el artículo de investigación apunta al aprendizaje autosupervisado?
A partir de ahí, el artículo de investigación conecta a SAI con el aprendizaje autosupervisado. La lógica es sencilla. Si el objetivo es una adaptación rápida en un espacio de tareas muy grande, entonces depender únicamente del aprendizaje supervisado se vuelve limitante porque los métodos supervisados suponen el acceso a conjuntos de datos etiquetados grandes y confiables. En entornos reales, esa suposición a menudo falla. El equipo de investigación sostiene que el aprendizaje autosupervisado es una vía prometedora porque puede explotar la estructura de los datos sin procesar y ya ha generado resultados sólidos en todos los dominios. Es importante destacar que no afirman que SAI requiera una arquitectura específica. Presentan el aprendizaje autosupervisado como una ruta prometedora, no como una respuesta arquitectónica final.
Modelos mundiales y límites de la predicción a nivel de superficie
El artículo de investigación también sostiene que una adaptación fuerte probablemente se beneficie de los modelos mundiales. Aquí el equipo de investigación se aleja de la idea de que la predicción a nivel de token o de píxel por sí sola es suficiente para obtener una inteligencia sólida en el mundo físico. Sostienen que lo que importa es aprender representaciones compactas que capturen la dinámica del sistema. Desde ese punto de vista, un modelo mundial respalda la simulación y la planificación, que a su vez respaldan la adaptación de pocas posibilidades y cero posibilidades. El artículo de investigación señala arquitecturas de predicción latente como JEPA, Dreamer 4 y Genie 2 como ejemplos del tipo de dirección que el campo debería explorar, al tiempo que afirma nuevamente que SAI no dicta una arquitectura única.
Una advertencia contra el monocultivo arquitectónico
El equipo de investigación también critica el nivel actual de homogeneidad arquitectónica en la IA avanzada. Señalan que los LLM y LMM autorregresivos dominan el panorama “general” de la IA en parte porque las herramientas y los puntos de referencia compartidos crean impulso. Pero el artículo de investigación sostiene que esta concentración reduce el espacio de búsqueda y puede ralentizar el progreso. Además, afirma que los sistemas autorregresivos tienen debilidades bien conocidas, incluida la acumulación de errores en horizontes largos, lo que hace que la interacción con horizontes largos sea frágil. Su punto más amplio no es que los grandes modelos actuales sean inútiles. Es que el campo debería evitar tratar un paradigma exitoso como el modelo final para la inteligencia.
Conclusiones clave
El artículo de investigación sostiene que la AGI no es un objetivo científico preciso: según el equipo de investigación, la AGI se utiliza de manera inconsistente en el mundo académico y la industria, lo que dificulta su definición, medición o uso como un objetivo de investigación estable. La inteligencia humana no debe ser tratada como la definición de inteligencia “general”: el artículo de investigación sostiene que los humanos parecen generales sólo dentro del espacio de tareas determinado por la biología y la supervivencia, pero fuera de ese rango, la capacidad humana es limitada. El equipo de investigación propone la Inteligencia Adaptable Sobrehumana (SAI) como un mejor objetivo: la SAI se define en torno a la capacidad de adaptarse más allá del desempeño humano en tareas humanas y también aprender tareas útiles fuera del dominio humano. La velocidad de adaptación es más importante que la amplitud de los puntos de referencia estáticos: en lugar de preguntar si un sistema ya conoce muchas tareas, el artículo de investigación se centra en la rapidez con la que puede adquirir nuevas habilidades y adaptarse a nuevos entornos. El artículo de investigación favorece la especialización, el aprendizaje autosupervisado y los modelos mundiales en lugar de un camino monolítico hacia la inteligencia: el equipo de investigación argumentó que los futuros sistemas de IA probablemente necesitarán especialización interna y un modelado mundial sólido, en lugar de asumir que una arquitectura universal resolverá todo.
Consulte el documento. Además, no dude en seguirnos en Twitter y no olvide unirse a nuestro SubReddit de más de 120.000 ML y suscribirse a nuestro boletín. ¡Esperar! estas en telegrama? Ahora también puedes unirte a nosotros en Telegram.