Para los “Cinco minutos con” de hoy nos reunimos con Gemma Jennings, gerente de producto del equipo de Applied, quien dirigió una sesión sobre modelos de lenguaje visual en el Cumbre de IA – uno de los eventos de IA para empresas más grandes del mundo.
En DeepMind…
Soy parte del equipo de Applied, que ayuda a llevar la tecnología DeepMind al mundo exterior a través de los productos y soluciones de Alphabet y Google, como con OndaNet y Asistente de Google, Mapas y Búsqueda. Como gerente de producto, actúo como puente entre las dos organizaciones, trabajando muy estrechamente con ambos equipos para comprender la investigación y cómo la gente puede utilizarla. En última instancia, queremos poder responder a la pregunta: ¿Cómo podemos utilizar esta tecnología para mejorar la vida de las personas en todo el mundo?
Estoy particularmente entusiasmado con nuestra cartera de trabajos de sostenibilidad. Ya hemos ayudado a reducir la cantidad de energía necesaria para enfriar los centros de datos de Google, pero hay mucho más que podemos hacer para tener un impacto transformador mayor dentro de la sostenibilidad.
Antes de DeepMind…
Trabajé en John Lewis Partnership, unos grandes almacenes del Reino Unido que tienen un fuerte sentido de propósito incorporado en su ADN. Siempre me ha gustado ser parte de una empresa con un sentido de propósito social, por lo que la misión de DeepMind de resolver la inteligencia para hacer avanzar la ciencia y beneficiar a la humanidad realmente resonó en mí. Me intrigó saber cómo se manifestaría ese espíritu dentro de una organización basada en la investigación y dentro de Google, una de las empresas más grandes del mundo. Sumando esto a mi formación académica en psicología experimental, neurociencia y estadística, DeepMind cumplía todos los requisitos.
La Cumbre de IA…
Es mi primera conferencia en persona en casi tres años, por lo que tengo muchas ganas de conocer gente de la misma industria que yo y escuchar en qué están trabajando otras organizaciones.
Tengo muchas ganas de asistir a algunas charlas sobre la computación cuántica para aprender más al respecto. Tiene el potencial de impulsar el próximo gran cambio de paradigma en la potencia informática, desbloqueando nuevos casos de uso para aplicar la IA en el mundo y permitiéndonos trabajar en problemas más grandes y complejos.
Mi trabajo implica muchos métodos de aprendizaje profundo y siempre es emocionante escuchar acerca de las diferentes formas en que las personas utilizan esta tecnología. Por el momento, este tipo de modelos requieren entrenamiento con grandes cantidades de datos, lo que puede resultar costoso, consumir mucho tiempo y consumir muchos recursos dada la cantidad de computación necesaria. Entonces, ¿dónde vamos desde aquí? ¿Y cómo es el futuro del aprendizaje profundo? Estos son los tipos de preguntas que busco responder.
Yo presenté…
Reconocimiento de imágenes mediante redes neuronales profundas, nuestro recientemente investigación publicada sobre modelos de lenguaje de visión (VLM). Para mi presentación, hablé de los avances recientes en la fusión de grandes modelos de lenguaje (LLM) con poderosas representaciones visuales para avanzar en el estado del arte del reconocimiento de imágenes.
Esta fascinante investigación tiene muchos usos potenciales en el mundo real. Algún día podría actuar como asistente para apoyar el aprendizaje en el aula y el informal en las escuelas, o ayudar a las personas con ceguera o baja visión a ver el mundo que les rodea, transformando su vida cotidiana.
Quiero que la gente abandone la sesión…
Con una mejor comprensión de lo que sucede después de que se anuncia el avance de la investigación. Se están realizando muchas investigaciones sorprendentes, pero debemos pensar en lo que viene después, por ejemplo, ¿qué problemas globales podríamos ayudar a resolver? ¿Y cómo podemos utilizar nuestra investigación para crear productos y servicios que tengan un propósito?
El futuro es brillante y estoy emocionado de descubrir nuevas formas de aplicar nuestra investigación innovadora para ayudar a beneficiar a millones de personas en todo el mundo.