En un desarrollo innovador publicado el 8 de noviembre de 2023, Giskard Bot se ha convertido en un punto de inflexión en los modelos de aprendizaje automático (ML), al atender a modelos de lenguaje grande (LLM) y modelos tabulares. Este marco de pruebas de código abierto, dedicado a garantizar la integridad de los modelos, aporta una gran cantidad de funcionalidades, todas perfectamente integradas con la plataforma HuggingFace (HF).
giskardLos objetivos principales son claros:
- Identificar vulnerabilidades.
- Generar pruebas específicas de dominio.
- Automatice la ejecución del conjunto de pruebas dentro de los procesos de integración continua/implementación continua (CI/CD).
Opera como una plataforma abierta para el control de calidad (QA) de la IA, alineándose con la filosofía comunitaria de Hugging Face.
Una de las integraciones más importantes introducidas es el bot Giskard en el concentrador HF. Este bot permite a los usuarios de Hugging Face publicar informes de vulnerabilidad automáticamente cada vez que se envía un nuevo modelo al centro HF. Estos informes, que se muestran en las discusiones de HF y en la tarjeta modelo a través de una solicitud de extracción, brindan una descripción general inmediata de problemas potenciales, como sesgos, preocupaciones éticas y solidez.
Un ejemplo convincente en el artículo ilustra la destreza del robot Giskard. Supongamos que se carga en HF Hub un modelo de análisis de sentimiento que utiliza Roberta para la clasificación de Twitter. El giskard El bot identifica rápidamente cinco vulnerabilidades potenciales, señalando transformaciones específicas en la función de “texto” que alteran significativamente las predicciones. Estos hallazgos subrayan la importancia de implementar estrategias de aumento de datos durante la construcción del conjunto de entrenamiento, ofreciendo una inmersión profunda en el rendimiento del modelo.
que conjuntos giskard aparte está su compromiso con la calidad más allá de la cantidad. El bot no sólo cuantifica las vulnerabilidades sino que también ofrece información cualitativa. Sugiere cambios en el modelo de tarjeta, destacando sesgos, riesgos o limitaciones. Estas sugerencias se presentan perfectamente como solicitudes de extracción en el centro HF, lo que agiliza el proceso de revisión para los desarrolladores de modelos.
El giskard el escaneo no se limita a los modelos estándar de PNL; extiende sus capacidades a los LLM, mostrando escaneos de vulnerabilidades para un modelo LLM RAG que hace referencia al informe del IPCC. El análisis descubre preocupaciones relacionadas con alucinaciones, desinformación, nocividad, divulgación de información confidencial y solidez. Por ejemplo, identifica automáticamente problemas como no revelar información confidencial sobre las metodologías utilizadas en la creación de los informes del IPCC.
Pero Giskard no se limita a la identificación; permite a los usuarios depurar problemas de manera integral. Los usuarios pueden acceder a un centro especializado en Hugging Face Spaces, obteniendo información útil sobre fallas del modelo. Esto facilita la colaboración con expertos en el campo y el diseño de pruebas personalizadas adaptadas a casos de uso únicos de IA.
Las pruebas de depuración se vuelven eficientes con Giskard. El bot permite a los usuarios comprender las causas fundamentales de los problemas y proporciona información automatizada durante la depuración. Sugiere pruebas, explica las contribuciones de palabras a las predicciones y ofrece acciones automáticas basadas en conocimientos.
Giskard no es una calle de sentido único; fomenta la retroalimentación de expertos en el dominio a través de su función “Invitar”. Esta retroalimentación agregada proporciona una visión holística de posibles mejoras del modelo, guiando a los desarrolladores a mejorar la precisión y confiabilidad del modelo.
Revisar la Artículo de referencia. Todo el crédito por esta investigación va a los investigadores de este proyecto. Además, no olvides unirte. nuestro SubReddit de 32k+ ML, 41k+ comunidad de Facebook, Canal de discordia, y Boletín electrónicodonde compartimos las últimas noticias sobre investigaciones de IA, interesantes proyectos de IA y más.
Si te gusta nuestro trabajo, te encantará nuestra newsletter.
también estamos en Telegrama y WhatsApp.
Niharika es pasante de consultoría técnica en Marktechpost. Es estudiante de tercer año y actualmente cursa su licenciatura en tecnología en el Instituto Indio de Tecnología (IIT), Kharagpur. Es una persona muy entusiasta con un gran interés en el aprendizaje automático, la ciencia de datos y la inteligencia artificial y una ávida lectora de los últimos avances en estos campos.