Screenshot 2024 07 02 At 3.11.38 Pm.png

El aprendizaje basado en conceptos (CBL) en el aprendizaje automático enfatiza el uso de conceptos de alto nivel a partir de características sin procesar para realizar predicciones, lo que mejora la interpretabilidad y la eficiencia del modelo. Un tipo destacado, el modelo de cuello de botella basado en conceptos (CBM), comprime las características de entrada en un espacio de baja dimensión para capturar datos esenciales y descartar la información no esencial. Este proceso mejora la explicabilidad en tareas como el reconocimiento de imágenes y voz. Sin embargo, los CBM a menudo requieren redes neuronales profundas y datos etiquetados extensos. Un enfoque más simple implica el aprendizaje de instancias múltiples (MIL), que etiqueta grupos de datos (bolsas) con etiquetas individuales desconocidas. Por ejemplo, la agrupación de parches de imágenes y la asignación de probabilidades en función de las etiquetas generales de las imágenes pueden inferir etiquetas de parches individuales.

Los investigadores de la Gran Universidad Politécnica de San Petersburgo han sido pioneros en un enfoque de CBL conocido como Inferencia Frecuentista CBL (FI-CBL). Este método implica segmentar imágenes etiquetadas con conceptos en parches y codificarlos en incrustaciones utilizando un autocodificador. Luego, estas incrustaciones se agrupan para identificar grupos correspondientes a conceptos específicos. FI-CBL determina las probabilidades de los conceptos para nuevas imágenes analizando la frecuencia de los parches asociados con cada valor de concepto. Además, FI-CBL integra el conocimiento de expertos a través de reglas lógicas, que ajustan las probabilidades de los conceptos en consecuencia. Este enfoque se destaca por su transparencia, interpretabilidad y eficacia, particularmente en escenarios con datos de entrenamiento limitados.

Los modelos CBL, incluidos los CBM, utilizan conceptos de alto nivel para realizar predicciones interpretables. Estos modelos abarcan diversas aplicaciones, desde el reconocimiento de imágenes hasta el análisis de datos tabulares, y son fundamentales en medicina. Los CBM presentan una estructura de dos módulos que separa el aprendizaje de conceptos y su impacto en la variable objetivo. Las innovaciones como los modelos de incorporación de conceptos y los CBM probabilísticos han mejorado su interpretabilidad y precisión. Además, la integración de conocimientos expertos en el aprendizaje automático, en particular a través de reglas lógicas, ha suscitado un interés significativo, con métodos que van desde las restricciones en las funciones de pérdida hasta las reglas de mapeo de componentes de redes neuronales.

El CBL implica un clasificador que predice tanto las variables objetivo como los conceptos a partir de un conjunto de pares de datos de entrenamiento. Cada par de datos incluye un vector de características de entrada, una clase objetivo y valores binarios de conceptos que indican la presencia o ausencia de conceptos. Los modelos CBL tienen como objetivo predecir y explicar cómo se relacionan estos conceptos con las predicciones. Esto se hace normalmente utilizando una función de dos pasos: mapear las entradas a los conceptos y luego los conceptos a los pronósticos. Por ejemplo, en las imágenes médicas, cada imagen se puede dividir en parches y sus incrustaciones se pueden agrupar para determinar las probabilidades de los conceptos, lo que permite que el modelo explique y destaque las áreas relevantes en las imágenes en función de estos conceptos.

La incorporación de reglas de expertos en el FI-CBL influye profundamente en el modelo probabilístico al ajustar las probabilidades previas y condicionales de los conceptos. Al integrar expresiones lógicas proporcionadas por expertos, como «SI el contorno es , ENTONCES el diagnóstico es «, el modelo perfecciona sus predicciones en función de estas restricciones. Esta mejora facilita una comprensión más matizada de los datos de imágenes médicas, donde las probabilidades previas para diagnósticos como aumentan o disminuyen según el cumplimiento de las reglas, lo que mejora la precisión y la interpretabilidad del diagnóstico. La integración de reglas de expertos permite a FI-CBL combinar la experiencia en el dominio con el modelado estadístico de manera eficaz, lo que mejora la confiabilidad y la perspicacia en los diagnósticos médicos.

El FI-CBL ofrece ventajas significativas sobre los CBM basados ​​en redes neuronales en ciertos escenarios. FI-CBL se caracteriza por su transparencia e interpretabilidad, brindando una secuencia clara de cálculos e interpretaciones probabilísticas explícitas de todos los resultados del modelo. Demuestra un rendimiento superior con pequeños conjuntos de datos de entrenamiento, aprovechando métodos estadísticos robustos para mejorar la precisión de la clasificación. Sin embargo, la efectividad de FI-CBL depende en gran medida de la agrupación precisa y la selección óptima del tamaño de parche, lo que plantea desafíos en escenarios con tamaños de concepto variados. A pesar de estos desafíos, la flexibilidad de FI-CBL en los ajustes de la arquitectura y la capacidad de integrar reglas expertas de manera efectiva lo convierten en un enfoque prometedor para mejorar la interpretabilidad y el rendimiento en tareas de aprendizaje automático.


Revisar la Papel. Todo el crédito por esta investigación corresponde a los investigadores de este proyecto. Además, no olvides seguirnos en Gorjeo.

Únete a nuestro Canal de Telegram y LinkedIn Gr¡Arriba!.

Si te gusta nuestro trabajo, te encantará nuestro Boletin informativo..

No olvides unirte a nuestro Subreddit de más de 45 000 millones de usuarios


Sana Hassan, pasante de consultoría en Marktechpost y estudiante de doble titulación en el IIT Madrás, es un apasionado de la aplicación de la tecnología y la IA para abordar los desafíos del mundo real. Con un gran interés en resolver problemas prácticos, aporta una perspectiva nueva a la intersección de la IA y las soluciones de la vida real.