¿Qué podemos aprender sobre la inteligencia humana al estudiar cómo “piensan” las máquinas? ¿Podremos comprendernos mejor a nosotros mismos si comprendemos mejor los sistemas de inteligencia artificial que se están convirtiendo en una parte cada vez más importante de nuestra vida cotidiana?
Estas preguntas pueden ser profundamente filosóficas, pero para Phillip Isola, encontrar las respuestas tiene que ver tanto con la computación como con la meditación.
Isola, el nuevo profesor asociado del Departamento de Ingeniería Eléctrica y Ciencias de la Computación (EECS), estudia los mecanismos fundamentales involucrados en la inteligencia humana desde una perspectiva computacional.
Si bien el objetivo general es comprender la inteligencia, su trabajo se centra principalmente en la visión por computadora y el aprendizaje automático. Isola está particularmente interesada en explorar cómo surge la inteligencia en los modelos de IA, cómo estos modelos aprenden a representar el mundo que los rodea y qué comparten sus “cerebros” con los cerebros de sus creadores humanos.
“Veo que todos los diferentes tipos de inteligencia tienen muchos puntos en común, y me gustaría entender esos puntos en común. ¿Qué es lo que todos los animales, los humanos y las IA tienen en común?” dice Isola, quien también es miembro del Laboratorio de Informática e Inteligencia Artificial (CSAIL).
Para Isola, una mejor comprensión científica de la inteligencia que poseen los agentes de IA ayudará al mundo a integrarlos de forma segura y eficaz en la sociedad, maximizando su potencial para beneficiar a la humanidad.
hacer preguntas
Isola comenzó a reflexionar sobre cuestiones científicas a una edad temprana.
Mientras crecía en San Francisco, él y su padre frecuentemente iban de excursión a lo largo de la costa norte de California o acampaban alrededor de Point Reyes y en las colinas del condado de Marin.
Le fascinaban los procesos geológicos y a menudo se preguntaba qué hacía funcionar el mundo natural. En la escuela, Isola estaba impulsado por una curiosidad insaciable y, aunque gravitaba hacia materias técnicas como matemáticas y ciencias, no había límite para lo que quería aprender.
Sin estar completamente seguro de qué estudiar como estudiante universitario en la Universidad de Yale, Isola incursionó hasta que encontró las ciencias cognitivas.
“Mi interés anterior había sido la naturaleza: cómo funciona el mundo. Pero luego me di cuenta de que el cerebro era aún más interesante y más complejo que incluso la formación de los planetas. Ahora quería saber qué es lo que nos motiva”, dice.
Como estudiante de primer año, comenzó a trabajar en el laboratorio de su profesor de ciencias cognitivas y futuro mentor, Brian Scholl, miembro del Departamento de Psicología de Yale. Permaneció en ese laboratorio durante toda su etapa universitaria.
Después de pasar un año sabático trabajando con algunos amigos de la infancia en una empresa independiente de videojuegos, Isola estaba lista para volver a sumergirse en el complejo mundo del cerebro humano. Se matriculó en el programa de posgrado en ciencias cognitivas y del cerebro del MIT.
“En la escuela de posgrado sentí que finalmente había encontrado mi lugar. Tuve muchas experiencias maravillosas en Yale y en otras fases de mi vida, pero cuando llegué al MIT, me di cuenta de que este era el trabajo que realmente amaba y que estas son las personas que piensan de manera similar a mí”, dice.
Isola atribuye a su asesor de doctorado, Ted Adelson, profesor de ciencias de la visión John y Dorothy Wilson, una gran influencia en su camino futuro. Se inspiró en el enfoque de Adelson en comprender los principios fundamentales, en lugar de simplemente perseguir nuevos puntos de referencia de ingeniería, que son pruebas formalizadas que se utilizan para medir el rendimiento de un sistema.
Una perspectiva computacional
En el MIT, la investigación de Isola desvió hacia la informática y la inteligencia artificial.
“Todavía me encantaban todas esas preguntas de las ciencias cognitivas, pero sentí que podía avanzar más en algunas de ellas si las abordaba desde una perspectiva puramente computacional”, dice.
Su tesis se centró en la agrupación perceptual, que involucra los mecanismos que utilizan las personas y las máquinas para organizar partes discretas de una imagen como un objeto único y coherente.
Si las máquinas pueden aprender agrupaciones perceptuales por sí solas, eso podría permitir que los sistemas de inteligencia artificial reconozcan objetos sin intervención humana. Este tipo de aprendizaje autosupervisado tiene aplicaciones en áreas como vehículos autónomos, imágenes médicas, robótica y traducción automática de idiomas.
Después de graduarse del MIT, Isola completó un postdoctorado en la Universidad de California en Berkeley para poder ampliar sus perspectivas trabajando en un laboratorio centrado únicamente en ciencias de la computación.
“Esa experiencia ayudó a que mi trabajo tuviera mucho más impacto porque aprendí a equilibrar la comprensión de los principios abstractos y fundamentales de la inteligencia con la búsqueda de algunos puntos de referencia más concretos”, recuerda Isola.
En Berkeley, desarrolló marcos de traducción de imagen a imagen, una forma temprana de modelo de IA generativa que podía convertir un boceto en una imagen fotográfica, por ejemplo, o convertir una fotografía en blanco y negro en una en color.
Entró en el mercado laboral académico y aceptó un puesto de profesor en el MIT, pero Isola lo pospuso por un año para trabajar en una entonces pequeña startup llamada OpenAI.
“Era una organización sin fines de lucro y me gustó la misión idealista de ese momento. Eran muy buenos en el aprendizaje por refuerzo y pensé que parecía un tema importante sobre el que aprender más”, dice.
Le gustaba trabajar en un laboratorio con tanta libertad científica, pero después de un año, Isola estaba lista para regresar al MIT y comenzar su propio grupo de investigación.
Estudiando la inteligencia humana
Dirigir un laboratorio de investigación le atrajo de inmediato.
“Realmente me encanta la etapa inicial de una idea. Siento que soy una especie de incubadora de startups donde constantemente puedo hacer cosas nuevas y aprender cosas nuevas”, dice.
Basándose en su interés por las ciencias cognitivas y su deseo de comprender el cerebro humano, su grupo estudia los cálculos fundamentales implicados en la inteligencia humana que surge en las máquinas.
Un enfoque principal es el aprendizaje de representación, o la capacidad de los humanos y las máquinas para representar y percibir el mundo sensorial que los rodea.
En un trabajo reciente, él y sus colaboradores observaron que los diversos tipos de modelos de aprendizaje automático, desde LLM hasta modelos de visión por computadora y modelos de audio, parecen representar el mundo de manera similar.
Estos modelos están diseñados para realizar tareas muy diferentes, pero existen muchas similitudes en sus arquitecturas. Y a medida que crecen y reciben más datos, sus estructuras internas se vuelven más parecidas.
Esto llevó a Isola y su equipo a introducir la Hipótesis de la Representación Platónica (que toma su nombre del filósofo griego Platón) que dice que las representaciones que aprenden todos estos modelos convergen hacia una representación subyacente compartida de la realidad.
“El lenguaje, las imágenes, el sonido son diferentes sombras en la pared de las que se puede inferir que existe algún tipo de proceso físico subyacente, algún tipo de realidad causal. Si entrenas modelos con todos estos diferentes tipos de datos, al final deberían converger en ese modelo mundial”, dice Isola.
Un área relacionada que estudia su equipo es el aprendizaje autosupervisado. Se trata de las formas en que los modelos de IA aprenden a agrupar píxeles relacionados en una imagen o palabras en una oración sin tener ejemplos etiquetados de los que aprender.
Debido a que los datos son costosos y las etiquetas limitadas, utilizar solo datos etiquetados para entrenar modelos podría frenar las capacidades de los sistemas de IA. Con el aprendizaje autosupervisado, el objetivo es desarrollar modelos que puedan generar por sí solos una representación interna precisa del mundo.
“Si puedes crear una buena representación del mundo, eso debería facilitar la resolución de problemas posteriores”, explica.
El objetivo de la investigación de Isola es más encontrar algo nuevo y sorprendente que construir sistemas complejos que puedan superar los últimos puntos de referencia de aprendizaje automático.
Si bien este enfoque ha tenido mucho éxito en el descubrimiento de técnicas y arquitecturas innovadoras, significa que el trabajo a veces carece de un objetivo final concreto, lo que puede generar desafíos.
Por ejemplo, mantener un equipo alineado y que la financiación fluya puede resultar difícil cuando el laboratorio se centra en buscar resultados inesperados, afirma.
“En cierto sentido, siempre trabajamos en la oscuridad. Es un trabajo de alto riesgo y alta recompensa. De vez en cuando, encontramos algo de verdad que es nuevo y sorprendente”, dice.
Además de buscar conocimientos, a Isola le apasiona impartir conocimientos a la próxima generación de científicos e ingenieros. Entre sus cursos favoritos para impartir se encuentra el 6.7960 (Aprendizaje profundo), que él y varios otros miembros del profesorado del MIT lanzaron hace cuatro años.
La clase ha experimentado un crecimiento exponencial, de 30 estudiantes en su oferta inicial a más de 700 este otoño.
Y si bien la popularidad de la IA significa que no hay escasez de estudiantes interesados, la velocidad a la que se mueve el campo puede hacer que sea difícil separar las exageraciones de los avances verdaderamente significativos.
“Les digo a los estudiantes que deben tomar todo lo que decimos en clase con cautela. Tal vez dentro de unos años les digamos algo diferente. Realmente estamos al borde del conocimiento con este curso”, dice.
Pero Isola también enfatiza a los estudiantes que, a pesar de todo el revuelo que rodea a los últimos modelos de IA, las máquinas inteligentes son mucho más simples de lo que la mayoría de la gente sospecha.
“Muchas personas creen que el ingenio, la creatividad y las emociones humanas nunca se pueden modelar. Eso podría resultar cierto, pero creo que la inteligencia es bastante simple una vez que la entendemos”, dice.
Aunque su trabajo actual se centra en modelos de aprendizaje profundo, Isola todavía está fascinado por la complejidad del cerebro humano y continúa colaborando con investigadores que estudian las ciencias cognitivas.
Mientras tanto, permaneció cautivado por la belleza del mundo natural que inspiró su primer interés por la ciencia.
Aunque actualmente tiene menos tiempo para pasatiempos, a Isola le gusta hacer caminatas y viajar con mochila en las montañas o en Cape Cod, esquiar y andar en kayak, o encontrar lugares pintorescos para pasar el tiempo cuando viaja para asistir a conferencias científicas.
Y mientras espera explorar nuevas preguntas en su laboratorio del MIT, Isola no puede evitar contemplar cómo el papel de las máquinas inteligentes podría cambiar el curso de su trabajo.
Él cree que la inteligencia artificial general (AGI), o el punto en que las máquinas puedan aprender y aplicar sus conocimientos tan bien como los humanos, no está tan lejos.
“No creo que las IA simplemente hagan todo por nosotros y que vayamos a disfrutar de la vida en la playa. Creo que habrá esta coexistencia entre máquinas inteligentes y humanos que todavía tienen mucha agencia y control. Ahora, estoy pensando en las preguntas y aplicaciones interesantes una vez que eso suceda. ¿Cómo puedo ayudar al mundo en este futuro post-AGI? Todavía no tengo ninguna respuesta, pero está en mi mente”, dice.