MIT-IBM Watson AI Lab semilla para señalar: amplificar el impacto de los docentes al inicio de su carrera

Los primeros años de las carreras de los profesores son un momento formativo y emocionante en el que establecer una base firme que ayude a determinar la trayectoria de los estudios de los investigadores. Esto incluye la creación de un equipo de investigación, que exige ideas y dirección innovadoras, colaboradores creativos y recursos confiables.

Para un grupo de profesores del MIT que trabajan con y sobre inteligencia artificial, el compromiso temprano con el Laboratorio de IA Watson del MIT-IBM a través de proyectos ha desempeñado un papel importante, ayudando a promover líneas de investigación ambiciosas y dando forma a grupos de investigación prolíficos.

Generando impulso

“El Laboratorio de IA del MIT-IBM Watson ha sido enormemente importante para mi éxito, especialmente cuando estaba empezando”, dice Jacob Andreas, profesor asociado en el Departamento de Ingeniería Eléctrica y Ciencias de la Computación (EECS), miembro del Laboratorio de Ciencias de la Computación e Inteligencia Artificial del MIT (CSAIL) e investigador del Laboratorio de IA del MIT-IBM Watson, que estudia el procesamiento del lenguaje natural (PLN). Poco después de unirse al MIT, Andreas puso en marcha su primer gran proyecto a través del MIT-IBM Watson AI Lab, trabajando en representación de lenguajes y métodos de aumento de datos estructurados para lenguajes de bajos recursos. “Realmente fue lo que me permitió poner en marcha mi laboratorio y empezar a reclutar estudiantes”.

Andreas señala que esto ocurrió durante un “momento crucial” en el que el campo de la PNL estaba experimentando cambios significativos para comprender los modelos de lenguaje, una tarea que requería mucha más computación, que estaba disponible a través del Laboratorio de IA Watson del MIT-IBM. “Siento que el tipo de trabajo que hicimos bajo ese [first] El proyecto, y en colaboración con toda nuestra gente del lado de IBM, fue de gran ayuda para descubrir cómo navegar esa transición”. Además, el grupo de Andreas pudo llevar a cabo proyectos de varios años sobre capacitación previa, aprendizaje por refuerzo y calibración para obtener respuestas confiables, gracias a los recursos informáticos y la experiencia dentro de la comunidad MIT-IBM.

Para varios otros miembros del profesorado, la participación oportuna en el laboratorio de IA Watson del MIT-IBM también resultó ser muy ventajosa. “Tener apoyo intelectual y también poder aprovechar algunos de los recursos computacionales que se encuentran dentro del MIT-IBM, ha sido completamente transformador e increíblemente importante para mi programa de investigación”, dice Yoon Kim, profesor asociado en EECS, CSAIL e investigador del Laboratorio de IA Watson del MIT-IBM, quien también ha visto cómo su campo de investigación altera su trayectoria. Antes de unirse al MIT, Kim conoció a sus futuros colaboradores durante un puesto postdoctoral en el MIT-IBM, donde se dedicó al desarrollo de modelos neurosimbólicos; Ahora, el equipo de Kim desarrolla métodos para mejorar las capacidades y la eficiencia del modelo de lenguaje grande (LLM).

Un factor que señala que condujo al éxito de su grupo es un proceso de investigación fluido con socios intelectuales. Esto le ha permitido a su equipo MIT-IBM postularse para un proyecto, experimentar a escala, identificar cuellos de botella, validar técnicas y adaptarse según sea necesario para desarrollar métodos de vanguardia para su posible inclusión en aplicaciones del mundo real. “Esto es un impulso para nuevas ideas y creo que eso es lo que hace única a esta relación”, dice Kim.

Fusionando experiencia

La naturaleza del MIT-IBM Watson AI Lab es que no solo reúne a investigadores en el ámbito de la IA para acelerar la investigación, sino que también combina el trabajo entre disciplinas. El investigador de laboratorio y profesor asociado del MIT en EECS y CSAIL, Justin Solomon, describe que su grupo de investigación creció con el laboratorio y que la colaboración fue “crucial… desde sus inicios hasta ahora”. El equipo de investigación de Solomon se centra en problemas geométricos de orientación teórica relacionados con los gráficos por computadora, la visión y el aprendizaje automático.

Solomon atribuye a la colaboración MIT-IBM la ampliación de su conjunto de habilidades, así como de las aplicaciones del trabajo de su grupo, un sentimiento que también comparten los investigadores del laboratorio Chuchu Fan, profesor asociado de aeronáutica y astronáutica y miembro del Laboratorio de Sistemas de Información y Decisión, y Faez Ahmed, profesor asociado de ingeniería mecánica. “Ellos [IBM] “Somos capaces de traducir algunos de estos problemas realmente complicados de ingeniería en el tipo de activos matemáticos en los que nuestro equipo puede trabajar y cerrar el círculo”, dice Solomon. Esto, para Solomon, incluye fusionar distintos modelos de IA que fueron entrenados en diferentes conjuntos de datos para tareas separadas. “Creo que todos estos son espacios realmente interesantes”, dice.

“Creo que estos proyectos iniciales de carrera [with the MIT-IBM Watson AI Lab] moldeó en gran medida mi propia agenda de investigación”, dice Fan, cuya investigación intersecta la robótica, la teoría de control y los sistemas críticos para la seguridad. Al igual que Kim, Solomon y Andreas, Fan y Ahmed comenzaron proyectos a través de la colaboración el primer año que pudieron en el MIT. Las restricciones y la optimización gobiernan los problemas que abordan Fan y Ahmed, y por lo tanto requieren un conocimiento profundo del dominio fuera de la IA.

Trabajar con el MIT-IBM Watson AI Lab permitió al grupo de Fan combinar métodos formales con el procesamiento del lenguaje natural, lo que, según ella, permitió al equipo pasar del desarrollo de tareas autorregresivas y planificación de movimientos para robots a la creación de agentes basados en LLM para la planificación de viajes, la toma de decisiones y la verificación. “Ese trabajo fue la primera exploración del uso de un LLM para traducir cualquier lenguaje natural de forma libre a alguna especificación que el robot pueda entender y ejecutar. Eso es algo de lo que estoy muy orgulloso y muy difícil en ese momento”, dice Fan. Además, a través de una investigación conjunta, su equipo ha podido mejorar el razonamiento del LLM, un trabajo que “sería imposible sin el apoyo de IBM”, afirma.

A través del laboratorio, la colaboración de Faez Ahmed facilitó el desarrollo de métodos de aprendizaje automático para acelerar el descubrimiento y el diseño dentro de sistemas mecánicos complejos. Su trabajo de Linkages, por ejemplo, emplea la “optimización generativa” para resolver problemas de ingeniería de una manera que se base en datos y sea precisa; más recientemente, están aplicando datos multimodales y LLM al diseño asistido por computadora. Ahmed afirma que la IA se aplica con frecuencia a problemas que ya tienen solución, pero que podrían beneficiarse de una mayor velocidad o eficiencia; sin embargo, los desafíos, como los vínculos mecánicos que se consideraban “casi irresolubles”, ahora están a nuestro alcance. “Creo que ese es definitivamente el sello [of our MIT-IBM team]”, dice Ahmed, elogiando los logros de su grupo MIT-IBM, codirigido por Akash Srivastava y Dan Gutfreund de IBM.

Lo que comenzó como colaboraciones iniciales para cada miembro del profesorado del MIT ha evolucionado hasta convertirse en una relación intelectual duradera, en la que ambas partes están “entusiasmadas con la ciencia” y “impulsadas por los estudiantes”, añade Ahmed. En conjunto, las experiencias de Jacob Andreas, Yoon Kim, Justin Solomon, Chuchu Fan y Faez Ahmed hablan del impacto que una relación duradera y práctica entre la academia y la industria puede tener en el establecimiento de grupos de investigación y una exploración científica ambiciosa.

MIT-IBM Watson AI Lab semilla para señalar: amplificar el impacto de los docentes al inicio de su carrera | Noticias del MIT

ByEquipo de 7 minutos

By Equipo de 7 minutos

Related Post

Vercel lanza Eve: un marco de agentes de IA de código abierto donde cada agente es un directorio de archivos asignados a capacidades

MiniMax Sparse Attention (MSA): una atención dispersa en bloques de dos ramas entrenada en un MoE de parámetros 109B con un presupuesto de 3T tokens

¿Podría la IA decirte dónde dejaste tus llaves? | Noticias del MIT

You missed

Trump ha creado un caos absoluto en el Senado

Cómo murió Saab como fabricante de automóviles y ahora es un gigante de la defensa de 27.000 millones de euros

“El ICE ha llegado a Palma”

Hija habla mientras los fanáticos reaccionan al divorcio de Bunnie XO