Responsabilidad y seguridad
Explorando las promesas y los riesgos de un futuro con una IA más capaz
Imagine un futuro en el que interactuemos regularmente con una variedad de asistentes avanzados de inteligencia artificial (IA), y en el que millones de asistentes interactúen entre sí en nuestro nombre. Estas experiencias e interacciones pronto podrían convertirse en parte de nuestra realidad cotidiana.
Los modelos básicos de uso general están allanando el camino para asistentes de IA cada vez más avanzados. Capaces de planificar y realizar una amplia gama de acciones en línea con los objetivos de una persona, podrían agregar un valor inmenso a la vida de las personas y a la sociedad, sirviendo como socios creativos, analistas de investigación, tutores educativos, planificadores de vida y más.
También podrían provocar una nueva fase de interacción humana con la IA. Por eso es tan importante pensar de manera proactiva sobre cómo podría ser este mundo y ayudar a orientar la toma de decisiones responsable y los resultados beneficiosos con anticipación.
Nuestro nuevo papel es el primer tratamiento sistemático de las cuestiones éticas y sociales que los asistentes avanzados de IA plantean a los usuarios, los desarrolladores y las sociedades en las que están integrados, y proporciona nuevos conocimientos importantes sobre el impacto potencial de esta tecnología.
Cubrimos temas como la alineación de valores, la seguridad y el mal uso, el impacto en la economía, el medio ambiente, la esfera de la información, el acceso y las oportunidades y más.
Este es el resultado de uno de nuestros mayores proyectos de previsión ética hasta la fecha. Reuniendo a una amplia gama de expertos, examinamos y mapeamos el nuevo panorama técnico y moral de un futuro poblado por asistentes de IA, y caracterizamos las oportunidades y riesgos que la sociedad podría enfrentar. Aquí describimos algunas de nuestras conclusiones clave.
Un profundo impacto en los usuarios y la sociedad
Ilustración del potencial de los asistentes de IA para impactar la investigación, la educación, las tareas creativas y la planificación.
Los asistentes avanzados de IA podrían tener un profundo impacto en los usuarios y la sociedad, y integrarse en la mayoría de los aspectos de la vida de las personas. Por ejemplo, las personas pueden pedirles que reserven vacaciones, gestionen el tiempo social o realicen otras tareas de la vida. Si se implementan a escala, los asistentes de IA podrían afectar la forma en que las personas abordan el trabajo, la educación, los proyectos creativos, los pasatiempos y la interacción social.
Con el tiempo, los asistentes de IA también podrían influir en los objetivos que persiguen las personas y su camino de desarrollo personal a través de la información y los consejos que brindan y las acciones que realizan. En última instancia, esto plantea preguntas importantes sobre cómo interactúan las personas con esta tecnología y cómo puede respaldar mejor sus objetivos y aspiraciones.
La alineación humana es esencial
Ilustración que muestra que los asistentes de IA deberían poder comprender las preferencias y valores humanos.
Es probable que los asistentes de IA tengan un nivel significativo de autonomía para planificar y realizar secuencias de tareas en una variedad de dominios. Debido a esto, los asistentes de IA presentan nuevos desafíos en materia de seguridad, alineación y mal uso.
Una mayor autonomía conlleva un mayor riesgo de accidentes causados por instrucciones poco claras o mal interpretadas, y un mayor riesgo de que los asistentes realicen acciones que no están alineadas con los valores e intereses del usuario.
Los asistentes de IA más autónomos también pueden permitir formas de uso indebido de alto impacto, como difundir información errónea o participar en ataques cibernéticos. Para abordar estos riesgos potenciales, sostenemos que se deben establecer límites a esta tecnología y que los valores de los asistentes avanzados de IA deben alinearse mejor con los valores humanos y ser compatibles con ideales y estándares sociales más amplios.
Comunicarse en lenguaje natural.
Ilustración de un asistente de IA y una persona comunicándose de forma humana.
Capaces de comunicarse con fluidez utilizando un lenguaje natural, la producción escrita y las voces de los asistentes avanzados de IA pueden resultar difíciles de distinguir de las de los humanos.
Este desarrollo abre un conjunto complejo de preguntas sobre la confianza, la privacidad, el antropomorfismo y las relaciones humanas apropiadas con la IA: ¿Cómo podemos asegurarnos de que los usuarios puedan identificar de manera confiable a los asistentes de IA y mantener el control de sus interacciones con ellos? ¿Qué se puede hacer para garantizar que los usuarios no se vean influenciados o engañados indebidamente con el tiempo?
Es necesario implementar salvaguardias, como las relacionadas con la privacidad, para abordar estos riesgos. Es importante destacar que las relaciones de las personas con los asistentes de IA deben preservar la autonomía del usuario, respaldar su capacidad de prosperar y no depender de una dependencia emocional o material.
Cooperar y coordinar para satisfacer las preferencias humanas.
Ilustración de cómo las interacciones entre los asistentes de IA y las personas crearán diferentes efectos de red.
Si esta tecnología está ampliamente disponible y se implementa a escala, los asistentes avanzados de IA necesitarán interactuar entre sí, tanto con usuarios como con no usuarios. Para ayudar a evitar problemas de acción colectiva, estos asistentes deben poder cooperar con éxito.
Por ejemplo, miles de asistentes podrían intentar reservar el mismo servicio para sus usuarios al mismo tiempo, lo que podría provocar que el sistema colapsara. En un escenario ideal, estos asistentes de IA se coordinarían en nombre de los usuarios humanos y los proveedores de servicios involucrados para descubrir puntos en común que satisfagan mejor las preferencias y necesidades de diferentes personas.
Dada la utilidad que puede llegar a tener esta tecnología, también es importante que nadie quede excluido. Los asistentes de IA deben ser ampliamente accesibles y estar diseñados teniendo en cuenta las necesidades de los diferentes usuarios y no usuarios.
Se necesitan más evaluaciones y previsión
Ilustración de cómo las evaluaciones en muchos niveles son importantes para comprender a los asistentes de IA.
Los asistentes de IA podrían mostrar capacidades novedosas y utilizar herramientas de formas nuevas que son difíciles de prever, lo que dificulta anticipar los riesgos asociados con su implementación. Para ayudar a gestionar esos riesgos, debemos adoptar prácticas de previsión que se basen en pruebas y evaluaciones integrales.
Nuestra investigación previa sobre Evaluación de los riesgos sociales y éticos de la IA generativa. Identificamos algunas de las brechas en los métodos tradicionales de evaluación de modelos y alentamos mucha más investigación en este espacio.
Por ejemplo, evaluaciones integrales que aborden los efectos de las interacciones entre humanos y computadoras y los efectos más amplios en la sociedad podrían ayudar a los investigadores a comprender cómo los asistentes de IA interactúan con los usuarios, los no usuarios y la sociedad como parte de una red más amplia. A su vez, estos conocimientos podrían contribuir a mejores mitigaciones y a una toma de decisiones responsable.
Construyendo el futuro que queremos
Es posible que estemos ante una nueva era de transformación tecnológica y social inspirada por el desarrollo de asistentes avanzados de IA. Las decisiones que tomemos hoy, como investigadores, desarrolladores, formuladores de políticas y miembros del público guiarán cómo se desarrolla y se implementa esta tecnología en la sociedad.
Esperamos que nuestro documento funcione como un trampolín para una mayor coordinación y cooperación para dar forma colectivamente al tipo de asistentes de IA beneficiosos que a todos nos gustaría ver en el mundo.