Las últimas investigaciones de Google DeepMind en ICML 2023

Explorando la seguridad, adaptabilidad y eficiencia de la IA para el mundo real

La próxima semana marca el inicio de la 40. Conferencia Internacional sobre Aprendizaje Automático (ICML 2023), que tendrá lugar del 23 al 29 de julio en Honolulu, Hawái.

ICML reúne a la comunidad de inteligencia artificial (IA) para compartir nuevas ideas, herramientas y conjuntos de datos, y hacer conexiones para avanzar en el campo. Desde visión artificial hasta robótica, investigadores de todo el mundo presentarán sus últimos avances.

Nuestro director de ciencia, tecnología y sociedad, Shakir Mohamed, dará una charla sobre aprendizaje automático con propósito socialabordando los desafíos de la atención médica y el clima, adoptando una visión sociotécnica y fortaleciendo las comunidades globales.

Estamos orgullosos de apoyar la conferencia como patrocinador platino y de continuar trabajando junto con nuestros socios a largo plazo. LatinX en IA, Queer en IAy Mujeres en el aprendizaje automático.

En la conferencia, también presentaremos demostraciones sobre AlphaFoldnuestros avances en ciencia de fusióny nuevos modelos como Palma-E para robótica y Fenaki para generar video a partir de texto.

Los investigadores de Google DeepMind están presentando más de 80 artículos nuevos en ICML este año. Como muchos documentos se enviaron antes Google Brain y DeepMind unieron fuerzaslos documentos enviados inicialmente bajo una afiliación de Google Brain se incluirán en un Blog de investigación de Googlemientras que este blog presenta documentos enviados bajo una afiliación de DeepMind.

IA en el mundo (simulado)

El éxito de la IA que puede leer, escribir y crear está respaldado por modelos básicos: sistemas de IA entrenados en grandes conjuntos de datos que pueden aprender a realizar muchas tareas. Nuestra última investigación explora cómo podemos traducir estos esfuerzos en el mundo real y sienta las bases para agentes de IA más capaces y encarnados en general que pueden comprender mejor la dinámica del mundo, abriendo nuevas posibilidades para herramientas de IA más útiles.

En una presentación oral, presentamos AdA, un agente de IA que puede adaptarse para resolver nuevos problemas en un entorno simulado, como lo hacen los humanos. En minutos, AdA puede asumir tareas desafiantes: combinar objetos de formas novedosas, navegar por terrenos ocultos y cooperar con otros jugadores.

Asimismo, mostramos cómo podríamos usar modelos de visión-lenguaje para ayudar a entrenar agentes encarnados – por ejemplo, diciéndole a un robot lo que está haciendo.

El futuro del aprendizaje por refuerzo

Para desarrollar una IA responsable y confiable, debemos comprender los objetivos en el corazón de estos sistemas. En el aprendizaje por refuerzo, una forma en que esto se puede definir es a través de la recompensa.

En una presentación oral, nuestro objetivo es resolver la hipótesis de la recompensa Postulado por primera vez por Richard Sutton, afirmando que se puede pensar que todas las metas maximizan la recompensa acumulada esperada. Explicamos las condiciones precisas bajo las cuales se cumple y aclaramos los tipos de objetivos que pueden y no pueden ser capturados por la recompensa en una forma general del problema de aprendizaje por refuerzo.

Al implementar sistemas de IA, deben ser lo suficientemente robustos para el mundo real. Miramos cómo mejorar entrenar algoritmos de aprendizaje por refuerzo dentro de las limitacionesya que las herramientas de IA a menudo tienen que ser limitadas por seguridad y eficiencia.

En nuestra investigación, que fue reconocida con un Premio al artículo destacado ICML 2023exploramos cómo podemos enseñar modelos complejos de estrategia a largo plazo bajo incertidumbre con juegos de información imperfecta. Compartimos cómo los modelos pueden jugar para ganar partidas de dos jugadores incluso sin conocer la posición y los posibles movimientos del otro jugador.

Desafíos en la frontera de la IA

Los seres humanos pueden aprender, adaptarse y comprender fácilmente el mundo que nos rodea. El desarrollo de sistemas avanzados de IA que puedan generalizarse de manera similar a la humana ayudará a crear herramientas de IA que podamos usar en nuestra vida cotidiana y para enfrentar nuevos desafíos.

Una forma en que la IA se adapta es cambiando rápidamente sus predicciones en respuesta a nueva información. En una presentación oral, analizamos plasticidad en redes neuronales y cómo se puede perder en el transcurso del entrenamiento, y formas de prevenir la pérdida.

También presentamos una investigación que podría ayudar a explicar el tipo de aprendizaje en contexto que surge en los grandes modelos lingüísticos al estudiar redes neuronales meta-entrenadas en datos fuentes cuyas estadísticas cambian espontáneamente, como en la predicción del lenguaje natural.

En una presentación oral, presentamos una nueva familia de redes neuronales recurrentes. (RNN) que se desempeñan mejor en tareas de razonamiento a largo plazo para desbloquear la promesa de estos modelos para el futuro.

Finalmente, en ‘asignación de crédito cuantilProponemos un enfoque para separar la suerte de la habilidad. Al establecer una relación más clara entre las acciones, los resultados y los factores externos, la IA puede comprender mejor los entornos complejos del mundo real.