La integración de la IA en las prácticas clínicas es un gran desafío, especialmente en radiología. Si bien se ha demostrado que la IA mejora la precisión del diagnóstico, su naturaleza de “caja negra” a menudo erosiona la confianza y la aceptación de los médicos. Los sistemas de apoyo a la decisión clínica (CDSS) actuales no son explicables o utilizan métodos como mapas de prominencia y valores de Shapley, que no brindan a los médicos una forma confiable de verificar las predicciones generadas por IA de forma independiente. Esta carencia es significativa, ya que limita el potencial de la IA en el diagnóstico médico y aumenta los peligros que implica una dependencia excesiva de resultados de IA potencialmente incorrectos. Para abordar esto se requieren nuevas soluciones que cierren el déficit de confianza y proporcionen a los profesionales de la salud las herramientas adecuadas para evaluar la calidad de las decisiones de IA en entornos exigentes como la atención médica.
Se han desarrollado técnicas de explicabilidad en la IA médica, como mapas de prominencia, razonamiento contrafactual y explicaciones del vecino más cercano, para hacer que los resultados de la IA sean más interpretables. El objetivo principal de las técnicas es explicar cómo predice la IA, brindando así a los médicos información útil para comprender el proceso de toma de decisiones detrás de las predicciones. Sin embargo, existen limitaciones. Uno de los mayores desafíos es la dependencia excesiva de la IA. Los médicos a menudo se dejan llevar por explicaciones potencialmente convincentes pero incorrectas presentadas por la IA.
Los sesgos cognitivos, como el sesgo de confirmación, empeoran significativamente este problema y a menudo conducen a decisiones incorrectas. Lo más importante es que estos métodos carecen de mecanismos de verificación sólidos, lo que permitiría a los médicos confiar en la confiabilidad de las predicciones de la IA. Estas limitaciones subrayan la necesidad de enfoques que vayan más allá de la explicabilidad para incluir características que respalden proactivamente la verificación y mejoren la colaboración entre humanos y IA.
Para abordar estas limitaciones, los investigadores de la Universidad de California en Los Ángeles UCLA introdujeron un enfoque novedoso llamado recuperación de 2 factores (2FR). Este sistema integra la verificación en la toma de decisiones de la IA, lo que permite a los médicos comparar las predicciones de la IA con ejemplos de casos etiquetados de manera similar. El diseño implica presentar diagnósticos generados por IA junto con imágenes representativas de una base de datos etiquetada. Estas ayudas visuales permiten a los médicos comparar ejemplos recuperados con la patología bajo revisión, lo que respalda el recuerdo del diagnóstico y la validación de decisiones. Este novedoso diseño reduce la dependencia y fomenta los procesos de diagnóstico colaborativos al hacer que los médicos participen más activamente en la validación de los resultados generados por la IA. El desarrollo mejora tanto la confianza como la precisión y, por lo tanto, es un notable paso adelante en la perfecta integración de la inteligencia artificial en la práctica clínica.
El estudio evaluó 2FR a través de un experimento controlado con 69 médicos de diversas especialidades y niveles de experiencia. Adoptó la radiografía de tórax de los NIH y contenía imágenes etiquetadas con las patologías de cardiomegalia, neumotórax, masa/nódulo y derrame. Este trabajo se distribuyó aleatoriamente en cuatro modalidades diferentes: predicciones de IA únicamente, predicciones de IA con mapas de prominencia, predicciones de IA con 2FR y sin asistencia de IA. Utilizó casos de diferentes dificultades, como fáciles y difíciles, para medir el efecto de la complejidad de la tarea. La precisión y la confianza del diagnóstico fueron las dos métricas principales, y los análisis se realizaron utilizando modelos lineales de efectos mixtos que controlan la experiencia del médico y la corrección de la IA. Este diseño es lo suficientemente sólido como para ofrecer una evaluación exhaustiva de la eficacia del método.
Los resultados muestran que 2FR mejora significativamente la precisión de los diagnósticos en estructuras de toma de decisiones asistidas por IA. Específicamente, cuando las predicciones generadas por IA fueron precisas, el nivel de precisión logrado con 2FR alcanzó el 70%, que fue significativamente mayor que el de los métodos basados en prominencia (65%), las predicciones de solo IA (64%) y las predicciones sin IA. Casos de soporte de IA (45%). Este método fue particularmente útil para los médicos menos confiados, ya que lograron mejoras muy significativas en comparación con otros enfoques. Los niveles de experiencia de los radiólogos también mejoraron bien con el uso de 2FR y, por lo tanto, mostraron una mayor precisión independientemente de los niveles de experiencia. Sin embargo, todas las modalidades disminuyeron de manera similar cuando las predicciones de la IA eran incorrectas. Esto muestra que los médicos confiaron principalmente en sus habilidades durante tales escenarios. Por tanto, estos resultados muestran la capacidad de 2FR para mejorar la confianza y el rendimiento del proceso en el diagnóstico, especialmente cuando las predicciones de la IA son precisas.
Esta innovación subraya aún más la tremenda capacidad transformadora de los enfoques basados en la verificación en los sistemas de apoyo a las decisiones de IA. Más allá de las limitaciones que se han atribuido a los métodos tradicionales de explicabilidad, 2FR permite a los médicos verificar con precisión las predicciones de la IA, lo que mejora aún más la precisión y la confianza. El sistema también alivia la carga de trabajo cognitivo y genera confianza en la toma de decisiones asistida por IA en radiología. Dichos mecanismos integrados en la colaboración entre humanos y IA brindarán optimización hacia un uso mejor y más seguro de las implementaciones de IA en la atención médica. Esto podría eventualmente usarse para explorar el impacto a largo plazo en las estrategias de diagnóstico, la capacitación de los médicos y los resultados de los pacientes. La próxima generación de sistemas de IA con 2FR tiene el potencial de contribuir considerablemente a los avances en la práctica médica con alta confiabilidad y precisión.
Verificar el Papel. Todo el crédito por esta investigación va a los investigadores de este proyecto. Además, no olvides seguirnos en Gorjeo y únete a nuestro Canal de telegramas y LinkedIn Grarriba. Si te gusta nuestro trabajo, te encantará nuestro hoja informativa.. No olvides unirte a nuestro SubReddit de más de 60.000 ml.
🚨 [Partner with us]: ‘Próxima revista/Informe: IA de código abierto en producción’
Aswin AK es pasante de consultoría en MarkTechPost. Está cursando su doble titulación en el Instituto Indio de Tecnología de Kharagpur. Le apasiona la ciencia de datos y el aprendizaje automático, y aporta una sólida formación académica y experiencia práctica en la resolución de desafíos interdisciplinarios de la vida real.