Poner la IA en manos de personas con problemas que resolver

Como estudiantes de Media Lab en 2010, Karthik Dinakar SM ’12, PhD ’17 y Birago Jones SM ’12 se unieron para un proyecto de clase para crear una herramienta que ayudaría a los equipos de moderación de contenido en empresas como Twitter (ahora X) y YouTube. El proyecto generó un enorme entusiasmo y los investigadores fueron invitados a hacer una demostración en una cumbre sobre ciberacoso en la Casa Blanca; sólo tenían que ponerlo en funcionamiento.

El día antes del evento en la Casa Blanca, Dinakar pasó horas tratando de armar una demostración funcional que pudiera identificar publicaciones preocupantes en Twitter. Alrededor de las 11 de la noche, llamó a Jones para decirle que se daba por vencido.

Entonces Jones decidió mirar los datos. Resultó que el modelo de Dinakar estaba señalando los tipos correctos de publicaciones, pero los carteles usaban términos de jerga adolescente y otro lenguaje indirecto que Dinakar no captó. El problema no era el modelo; era la desconexión entre Dinakar y los adolescentes a los que intentaba ayudar.

“Entonces nos dimos cuenta, justo antes de llegar a la Casa Blanca, de que las personas que construyen estos modelos no deberían ser simplemente ingenieros de aprendizaje automático”, dice Dinakar. “Deberían ser las personas que mejor comprendan sus datos”.

Esta idea llevó a los investigadores a desarrollar herramientas de apuntar y hacer clic que permiten a los no expertos construir modelos de aprendizaje automático. Esas herramientas se convirtieron en la base de Pienso, que hoy ayuda a las personas a crear grandes modelos de lenguaje para detectar información errónea, trata de personas, venta de armas y más, sin escribir ningún código.

“Este tipo de aplicaciones son importantes para nosotros porque nuestras raíces están en el ciberacoso y en la comprensión de cómo utilizar la IA para cosas que realmente ayuden a la humanidad”, afirma Jones.

En cuanto a la primera versión del sistema mostrada en la Casa Blanca, los fundadores terminaron colaborando con estudiantes de escuelas cercanas en Cambridge, Massachusetts, para permitirles entrenar los modelos.

“Los modelos que esos niños entrenaron eran mucho mejores y tenían más matices que cualquier cosa que se me hubiera ocurrido”, dice Dinakar. “Birago y yo tuvimos este gran ‘¡Ajá!’ momento en el que nos dimos cuenta de que empoderar a los expertos en el campo, que es diferente de democratizar la IA, era el mejor camino a seguir”.

Un proyecto con propósito

Jones y Dinakar se conocieron cuando eran estudiantes de posgrado en el grupo de investigación de Agentes de Software del MIT Media Lab. Su trabajo en lo que se convirtió en Pienso comenzó en el curso 6.864 (Procesamiento del lenguaje natural) y continuó hasta que obtuvieron su maestría en 2012.

Resultó que 2010 no fue la última vez que invitaron a los fundadores a la Casa Blanca para hacer una demostración de su proyecto. El trabajo generó mucho entusiasmo, pero los fundadores trabajaron en Pienso a tiempo parcial hasta 2016, cuando Dinakar terminó su doctorado en el MIT y el aprendizaje profundo comenzó a ganar popularidad.

“Todavía estamos conectados con muchas personas en el campus”, dice Dinakar. “La exposición que tuvimos en el MIT, la fusión de interfaces humanas y de computadora, amplió nuestra comprensión. Nuestra filosofía en Pienso no podría ser posible sin la vitalidad del campus del MIT”.

Los fundadores también le dan crédito al Industrial Liaison Program (ILP) y al Startup Accelerator (STEX) del MIT por conectarlos con los primeros socios.

Uno de los primeros socios fue SkyUK. El equipo de éxito del cliente de la empresa utilizó Pienso para crear modelos para comprender los problemas más comunes de sus clientes. Hoy en día, esos modelos ayudan a procesar medio millón de llamadas de clientes al día, y los fundadores dicen que han ahorrado a la empresa más de £7 millones de libras hasta la fecha al acortar la duración de las llamadas al centro de llamadas de la empresa.

“La diferencia entre democratizar la IA y empoderar a las personas con ella se reduce a quién comprende mejor los datos: ¿usted, un médico, un periodista o alguien que trabaja con clientes todos los días? dice Jones. “Esas son las personas que deberían crear los modelos. Así es como se obtienen conocimientos a partir de los datos”.

En 2020, justo cuando comenzaron los brotes de Covid-19 en EE. UU., los funcionarios del gobierno se pusieron en contacto con los fundadores para utilizar su herramienta para comprender mejor la enfermedad emergente. Pienso ayudó a expertos en virología y enfermedades infecciosas a configurar modelos de aprendizaje automático para extraer miles de artículos de investigación sobre coronavirus. Dinakar dice que más tarde se enteraron de que el trabajo ayudó al gobierno a identificar y fortalecer cadenas de suministro críticas de medicamentos, incluido el popular antiviral remdesivir.

“Esos compuestos fueron descubiertos por un equipo que no conocía el aprendizaje profundo pero que podía utilizar nuestra plataforma”, dice Dinakar.

Construyendo un futuro mejor para la IA

Debido a que Pienso puede ejecutarse en servidores internos e infraestructura de nube, los fundadores dicen que ofrece una alternativa para las empresas que se ven obligadas a donar sus datos mediante el uso de servicios ofrecidos por otras empresas de inteligencia artificial.

“La interfaz de Pienso es una serie de aplicaciones web unidas”, explica Dinakar. “Puedes considerarlo como un Adobe Photoshop para modelos de lenguaje grandes, pero en la web. Puede apuntar e importar datos sin escribir una línea de código. Puedes refinar los datos, prepararlos para el aprendizaje profundo, analizarlos, darles estructura si no están etiquetados o anotados, y puedes terminar con un modelo de lenguaje grande y afinado en cuestión de 25 minutos”.

A principios de este año, Pienso anunció una asociación con GraphCore, que proporciona una plataforma informática más rápida y eficiente para el aprendizaje automático. Los fundadores dicen que la asociación reducirá aún más las barreras para aprovechar la IA al reducir drásticamente la latencia.

“Si estás construyendo una plataforma interactiva de IA, los usuarios no tomarán una taza de café cada vez que hagan clic en un botón”, afirma Dinakar. “Tiene que ser rápido y receptivo”.

Los fundadores creen que su solución está permitiendo un futuro en el que las personas que están más familiarizadas con los problemas que están tratando de resolver desarrollan modelos de IA más efectivos para casos de uso específicos.

“Ningún modelo puede hacerlo todo”, dice Dinakar. “La aplicación de cada uno es diferente, sus necesidades son diferentes, sus datos son diferentes. Es muy poco probable que un modelo haga todo por usted. Se trata de reunir un conjunto de modelos y permitirles colaborar entre sí y orquestarlos de una manera que tenga sentido, y las personas que realizan esa orquestación deben ser las que mejor comprendan los datos”.

Poner la IA en manos de personas con problemas que resolver | Noticias del MIT

ByEquipo de 7 minutos

By Equipo de 7 minutos

Related Post

Cómo utilizar AgentTrove: transmisión de 1,7 millones de seguimientos agentes y creación de un conjunto de datos SFT ShareGPT limpio en Python

Cree una solución de observabilidad empresarial para Amazon Quick

Genesis AI lanza la plataforma de física Nyx, Quadrants y Genesis World 1.0 para la evaluación de modelos escalables de Robotics Foundation

You missed

Tuberías de Rules – Noticias Gaceta Costa Tropical

Blog de chismes deportivos n.° 1 en el mundo

Cómo utilizar AgentTrove: transmisión de 1,7 millones de seguimientos agentes y creación de un conjunto de datos SFT ShareGPT limpio en Python

Los fotones se comportan de forma muy extraña si intentas cortarlos.