Marco de seis pasos para gestionar los riesgos éticos y de reputación de la IA generativa en su producto |  de Sarthak Handa |  febrero de 2024

La gestión de los riesgos de la IA requiere un enfoque reflexivo durante todo el ciclo de vida del producto. A continuación se muestra un marco de seis pasos, organizado por diferentes etapas de desarrollo de la IA, que las organizaciones pueden adoptar para garantizar el uso responsable de la tecnología de IA en sus productos.

Fuente: Autor

1. Predesarrollo: Bases éticas y principios de diseño

Antes de escribir una sola línea de código, los equipos de producto deben sentar las bases. Priorizar la interacción temprana con un amplio conjunto de partes interesadas, incluidos usuarios, expertos técnicos, especialistas en ética, profesionales del derecho y miembros de comunidades que puedan verse afectados por la aplicación de IA. El objetivo es identificar los riesgos tanto manifiestos como sutiles asociados con el caso de uso del producto. Utilice estos conocimientos para definir el conjunto de directrices éticas y capacidades del producto que deben incorporarse al producto antes de su lanzamiento para abordar de forma preventiva los riesgos identificados.

2. Desarrollo: consentimiento de datos, integridad, diversidad

Los datos son la base de la IA y también la fuente más importante de riesgos de la IA. Es fundamental garantizar que todos los datos adquiridos para la capacitación del modelo provengan de fuentes éticas y cuenten con el consentimiento para el uso previsto. Por ejemplo, Adobe entrenó su modelo de generación de imágenes (Luciérnaga) con datos de propiedad que le permiten brindar protección legal a los usuarios contra demandas por derechos de autor.

Además, la información de identificación personal (PII) debe eliminarse de los conjuntos de datos confidenciales utilizados para entrenar modelos para evitar posibles daños. El acceso a dichos conjuntos de datos debe estar debidamente controlado y rastreado para proteger la privacidad. Es igualmente importante garantizar que los conjuntos de datos representen la diversidad de la base de usuarios y la amplitud de escenarios de uso para mitigar los riesgos de sesgo y equidad. Empresas como Pista han entrenado sus modelos de conversión de texto a imagen con conjuntos de datos sintéticos que contienen imágenes generadas por IA de personas de diferentes etnias, géneros, profesiones y edades para garantizar que sus modelos de IA muestren diversidad en el contenido que crean.

3. Desarrollo: Pruebas de robustez e implementación de barandillas

La fase de prueba es fundamental para determinar si la IA está preparada para su lanzamiento público. Esto implica comparar el resultado de la IA con el conjunto seleccionado de resultados verificados. Una prueba eficaz utiliza:

  • Métricas de rendimiento alineado con los objetivos del usuario y los valores comerciales,
  • Datos de evaluación Representar a usuarios de diferentes grupos demográficos y cubrir una variedad de escenarios de uso, incluidos los casos extremos.

Además de las pruebas de rendimiento, también es fundamental implementar medidas de seguridad que impidan que la IA produzca resultados perjudiciales. Por ejemplo, ImagenFX, GoogleEl servicio de generación de imágenes de Google bloquea proactivamente a los usuarios para que no generen contenido que pueda considerarse inapropiado o usarse para difundir información errónea. Similarmente, antrópico ha establecido proactivamente barreras y medidas para evitar el uso indebido de sus servicios de inteligencia artificial en las elecciones de 2024.

4. Desarrollo: explicabilidad y empoderamiento

En casos de uso críticos de la industria donde generar confianza es fundamental, es importante que la IA permita a los humanos desempeñar una función de asistencia. Esto se puede lograr mediante:

  • Proporcionar citas de las fuentes de los conocimientos de la IA.
  • Destacando la incertidumbre o el nivel de confianza de la predicción de la IA.
  • Ofrecer a los usuarios la opción de optar por no utilizar la IA.
  • Crear flujos de trabajo de aplicaciones que garanticen la supervisión humana y eviten que algunas tareas se automaticen por completo.

5. Implementación: implementación progresiva y transparencia

A medida que los sistemas de IA pasan del desarrollo a la implementación en el mundo real, adoptar una estrategia de implementación gradual es crucial para evaluar los riesgos y recopilar comentarios en un entorno controlado. También es importante comunicar claramente el caso de uso previsto, las capacidades y las limitaciones de la IA a los usuarios y partes interesadas. La transparencia en esta etapa ayuda a gestionar las expectativas y mitiga los riesgos reputacionales asociados con fallas inesperadas del sistema de inteligencia artificial.

AbiertoAIpor ejemplo, demostró este enfoque con sora, su último servicio de texto a video, al poner inicialmente el servicio a disposición solo de un grupo selecto de miembros del equipo rojo y profesionales creativos. Ha sido sincero sobre las capacidades de Sora, así como sobre sus limitaciones actuales, como los desafíos en la generación de videos que involucran interacciones físicas complejas. Este nivel de divulgación garantiza que los usuarios comprendan dónde destaca la tecnología y dónde podría fallar, gestionando así las expectativas, ganándose la confianza de los usuarios y facilitando la adopción responsable de la tecnología de IA.

6. Implementación: seguimiento, retroalimentación y adaptación

Una vez que un sistema de IA entra en funcionamiento, el trabajo no termina. Ahora viene la tarea de vigilar de cerca cómo se comporta la IA en la naturaleza y ajustarla en función de lo que encuentres. Cree un mecanismo continuo para realizar un seguimiento de las desviaciones del rendimiento y probar y entrenar continuamente el modelo con datos nuevos para evitar la degradación del rendimiento de la IA. Facilite a los usuarios señalar problemas y utilizar estos conocimientos para adaptar la IA y actualizar constantemente las barreras de seguridad para cumplir con altos estándares éticos. Esto garantizará que los sistemas de IA sigan siendo fiables y dignos de confianza y estén en sintonía con el mundo dinámico en el que operan.