Los sistemas de inteligencia artificial están convergiendo en la percepción humana de la realidad

La Teoría de las Formas de Platón aborda la cuestión de cómo sabemos que un objeto, como una mesa, es lo que es, aunque nunca lo hayamos visto antes y aunque pueda parecer completamente diferente a cualquier mesa que hayamos visto.

La respuesta de Platón es que una mesa adquiere su “mesa” porque participa de la Forma perfecta de una mesa. Esta Forma es una entidad ideal, absoluta y atemporal que es la esencia de la mesa pero que no podemos experimentar directamente.

En su Alegoría de la Cueva, Platón explicó que el mundo de las Formas no es accesible a los sentidos humanos y que todo lo que experimentamos son las sombras imperfectas de las Formas, como si fueran proyectadas por la luz del fuego sobre las paredes de una cueva.

La Teoría de las Formas de Platón no figura en la visión moderna del universo, que experimentamos directa e indirectamente y llegamos a comprender a través del proceso iterativo de la ciencia. De esta manera, los humanos tienden a ponerse de acuerdo sobre qué constituye el universo y cómo se comporta.

Datos seleccionados

Pero los sistemas artificialmente inteligentes, como los grandes modelos de lenguaje y los sistemas de visión artificial, aprenden sobre el mundo de una manera diferente. Todo lo que saben proviene de conjuntos seleccionados de palabras, imágenes y otras formas de datos.

Y eso plantea la cuestión de si estos sistemas acaban teniendo una “visión” similar del mundo. Y si estos puntos de vista están convergiendo a medida que los sistemas de IA se vuelven más capaces.

Ahora tenemos una respuesta a esta pregunta gracias al trabajo de Minyoung Huh y sus colegas del Instituto Tecnológico de Massachusetts en Cambridge. Este grupo dice que a medida que las redes neuronales se vuelven más poderosas, sus representaciones del mundo se vuelven más alineadas. Esto parece ser cierto independientemente del tipo de modelo, ya sea un sistema de visión, un modelo de lenguaje o algún otro sistema.

“Esta similitud abarca diferentes arquitecturas de modelos, objetivos de capacitación e incluso modalidades de datos”, dicen, y agregan que creen saber por qué está ocurriendo esta convergencia y dónde terminará.

Ahí es donde entra en juego la Teoría de las Formas de Platón. Huh y compañía dicen que la razón por la que estos sistemas convergen es que todos intentan llegar a una representación de la misma realidad. Esta realidad genera los puntos de datos utilizados para entrenar estos modelos, por lo que no debería sorprender que los modelos se alineen en su representación de estos datos.

“A esta representación hipotética convergente la llamamos “representación platónica” en referencia a la Alegoría de la Caverna de Platón y su idea de una realidad ideal que subyace a nuestras sensaciones”, dicen.

El equipo continúa probando esta hipótesis utilizando redes neuronales que representan el mundo en términos de vectores y su relación entre sí. Por ejemplo, una forma de representar palabras es observar la probabilidad de que una palabra aparezca junto a otra, luego a otra palabra y, finalmente, a todas las demás palabras. Este conjunto de probabilidades se puede representar como un vector que coloca la palabra en una posición específica dentro de un espacio vectorial multidimensional.

Utilizando este enfoque, los informáticos pueden estudiar los patrones que surgen dentro de este espacio vectorial. Han descubierto que las palabras con funciones similares suelen formar grupos; colores, por ejemplo, o emociones positivas y negativas.

Y la posición de las palabras dentro de este espacio vectorial es en gran medida invariante en los diferentes idiomas. Por lo tanto, el proceso de traducir una oración de un idioma a otro es equivalente a mapear el patrón de vínculos entre palabras en un espacio lingüístico con el mismo patrón en otro espacio lingüístico.

Las redes neuronales entrenadas en imágenes producen representaciones vectoriales similares.

Eso permite a Huh y compañía medir las distancias entre conceptos similares en estos espacios y luego compararlos. Encuentran que “las formas en que las diferentes redes neuronales representan datos están cada vez más alineadas”. Y la alineación mejora a medida que las redes se vuelven más grandes y poderosas.

“Esto sugiere que la alineación del modelo aumentará con el tiempo; podríamos esperar que la próxima generación de modelos mejores y más grandes esté aún más alineada entre sí”, dicen Huh y compañía.

Percepcion humana

Es más, estos sistemas también se están alineando con la forma en que el cerebro humano percibe el mundo. Esto no debería sorprendernos, afirman Huh y compañía. “Aunque los medios pueden diferir (transistores de silicio versus neuronas biológicas), el problema fundamental que enfrentan los cerebros y las máquinas es el mismo: extraer y comprender de manera eficiente la estructura subyacente en imágenes, texto, sonidos, etc.”

Los investigadores utilizan esta forma de pensar sobre las redes neuronales para hacer algunas predicciones notables. Señalan, por ejemplo, que las redes neuronales funcionan encontrando una representación simple que se ajuste a un conjunto de datos determinado.

Este sesgo hacia la simplicidad sugiere que a medida que los modelos se hacen más grandes, deberían converger hacia un espacio de solución más pequeño. El punto final de este proceso, dicen, debería ser un modelo unificado basado en las propiedades estadísticas del mundo subyacente. “Nuestra hipótesis es que esta convergencia conduce hacia un modelo estadístico compartido de la realidad, similar al concepto de realidad ideal de Platón”, dicen Huh y compañía.

Una limitación de este enfoque es que el trabajo se centra en conjuntos de datos de lenguaje e imágenes, cuando hay muchos otros tipos de percepción que pueden no estar alineados de la misma manera. No es fácil imaginar hasta qué punto el tacto o el olfato, por ejemplo, pueden alinearse con una base de datos de imágenes o palabras.

Pero el trabajo sugiere que estas diferentes modalidades o percepciones contribuyen a un mejor modelo del mundo real. Esto es consistente con el llamado “escenario de Anna Karenina”, basado en la famosa primera línea de la novela de Tolstoi: “Todas las familias felices son iguales; cada familia infeliz lo es a su manera”.

En este espíritu, digamos en Huh y compañía, todas las redes neuronales grandes son buenas de manera similar, pero todas las redes neuronales pequeñas son malas de diferentes maneras. La sorprendente implicación es que, aunque actualmente los humanos y las computadoras perciben el mundo de diferentes maneras, algún día esta percepción será esencialmente la misma. ¡Platón seguramente lo aprobaría!


Ref: La hipótesis de la representación platónica: https://arxiv.org/abs/2405.07987