MÁS de 100.000 mujeres suecas pasaron por máquinas de mamografía entre 2021 y 2022, cada una asignada al azar para que dos radiólogos que trabajaran juntos o una inteligencia artificial respaldada por un solo lector humano leyeran sus exploraciones. Dos años más tarde, las mujeres cuyas imágenes recibieron apoyo de la IA tuvieron un 12 por ciento menos de cánceres agresivos entre sus citas de detección habituales: la primera evidencia sólida de que el aprendizaje automático podría detectar tumores que los ojos humanos pasan desapercibidos.
Los resultados del ensayo MASAI, publicados en The Lancet, resuelven una cuestión que ha estado molestando a los investigadores del cáncer de mama desde que los sistemas de inteligencia artificial comenzaron a igualar la precisión de los radiólogos en las pruebas de laboratorio. Sí, estos algoritmos pueden encontrar más cánceres durante el cribado (un 29 por ciento más en este estudio). Pero, ¿detectan los peligrosos lo suficientemente temprano como para que importen, o simplemente señalan anomalías inofensivas que nunca habrían causado problemas? La respuesta parece ser la primera.
“Nuestro estudio es el primer ensayo controlado aleatorio que investiga el uso de la IA en la detección del cáncer de mama y el más grande hasta la fecha que analiza el uso de la IA en la detección del cáncer en general”, afirma Kristina Lång de la Universidad de Lund, quien dirigió el ensayo. La detección respaldada por IA mejoró la detección temprana de cánceres de mama clínicamente relevantes, lo que llevó a que se diagnosticaran menos cánceres agresivos o avanzados entre las pruebas.
Los cánceres de intervalo (aquellos diagnosticados después de una mamografía negativa pero antes de la siguiente prueba programada) tienden a ser más desagradables que los cánceres detectados durante los controles de rutina. Suelen ser más grandes, es más probable que se hayan diseminado a los ganglios linfáticos y con mayor frecuencia pertenecen a subtipos moleculares agresivos. Aproximadamente entre el 20 y el 30 por ciento de ellos podrían haber sido visibles en la mamografía anterior si alguien hubiera sabido dónde buscar.
El ensayo sueco utilizó un sistema de inteligencia artificial llamado Transpara, entrenado en más de 200.000 mamografías de múltiples países y tipos de equipos de imágenes. El software asignó a cada exploración una puntuación de riesgo del 1 al 10 y un solo radiólogo revisó las imágenes de bajo riesgo (puntuaciones del 1 al 9) o dos radiólogos abordaron las de alto riesgo (puntuación 10), y la IA destacó las regiones sospechosas para su consideración. La práctica estándar en los programas de detección europeos implica que dos radiólogos lean cada mamografía de forma independiente.
Lo que sucedió durante los dos años siguientes nos dice algo sobre qué cánceres importan. El grupo de IA tuvo 1,55 cánceres de intervalo por cada 1.000 mujeres examinadas, en comparación con 1,76 en el grupo de doble lectura estándar (esa es la reducción del 12 por ciento, aunque el ensayo fue diseñado sólo para demostrar que la IA no era peor, ni que fuera definitivamente mejor). Lo que es más revelador es que el grupo de IA tuvo un 16 por ciento menos de cánceres de intervalo invasivos, un 21 por ciento menos de tumores grandes de más de 20 milímetros y un 27 por ciento menos de subtipos agresivos no luminales A (los cánceres triple negativo, HER2 positivo y luminal B que más se benefician de la detección temprana).
Las cifras de sensibilidad (la proporción de todos los cánceres que realmente detectan las pruebas de detección) aumentaron del 73,8 por ciento con doble lectura estándar al 80,5 por ciento con el apoyo de la IA. Esa mejora se mantuvo en diferentes grupos de edad y densidades mamarias, y específicamente en los cánceres invasivos. Mientras tanto, la especificidad se mantuvo sólida en un 98,5 por ciento para ambos grupos, lo que significa que las falsas alarmas no aumentaron.
Aquí está la parte que realmente podría llevar la IA a las clínicas a pesar de la legendaria resistencia al cambio de los sistemas de salud. El flujo de trabajo respaldado por IA redujo el número de lecturas de mamografías casi a la mitad (de 109.692 a 61.248 en todo el ensayo) porque las exploraciones de bajo riesgo solo necesitaban un radiólogo en lugar de dos. Las reuniones de consenso, en las que los radiólogos analizan juntos casos ambiguos, se produjeron aproximadamente al mismo ritmo (3,8 por ciento frente a 3,7 por ciento).
“Nuestro estudio no respalda la sustitución de los profesionales sanitarios por IA”, subraya Jessie Gommers, primera autora del ensayo del Centro Médico de la Universidad de Radboud. La detección respaldada por IA todavía requiere al menos un radiólogo humano para realizar la lectura de la pantalla, pero con el apoyo de la IA. Los resultados justifican potencialmente el uso de IA para aliviar una presión sustancial sobre las cargas de trabajo de los radiólogos, permitiendo a estos expertos centrarse en otras tareas clínicas.
Suecia enfrenta la misma escasez de radiólogos que la mayoría de los países ricos: muy pocos especialistas, demasiadas exploraciones y tiempos de espera cada vez mayores. Si la IA puede mantener o mejorar la detección del cáncer y al mismo tiempo reducir a la mitad la carga de lectura, ese es el tipo de ganancia de eficiencia que interesa a los administradores de los hospitales. Que sea realmente rentable depende de cuánto cueste el software versus el valor de detectar más cánceres en forma temprana, y ese análisis aún está en marcha.
El ensayo tuvo limitaciones que vale la pena señalar. Un país, cuatro sitios de detección pero un centro de lectura, un tipo de máquina de mamografía, un sistema de inteligencia artificial, radiólogos experimentados y tasas de recuperación de referencia ya impresionantemente bajas según los estándares internacionales (alrededor del 2 por ciento). Los resultados pueden diferir en otros lugares, particularmente con lectores menos experimentados o diferentes configuraciones de detección. Los investigadores no rastrearon datos de raza o etnia, ya que Suecia no los recopila de forma rutinaria en los programas de detección. Y, lo que es más importante, esto cubre solo una ronda de detección: nadie sabe todavía si los beneficios persisten o se desvanecen a medida que los radiólogos y los sistemas de inteligencia artificial establecen relaciones de trabajo a largo plazo.
También existe una preocupación persistente sobre el sobrediagnóstico. El grupo de IA detectó más carcinoma ductal in situ (CDIS o cambios mamarios preinvasivos) sin una caída correspondiente en los diagnósticos de DCIS de intervalo. Algunas de esas detecciones adicionales fueron lesiones de alto grado que probablemente se convirtieron en cáncer invasivo, pero otras fueron hallazgos de bajo grado que tal vez nunca hubieran causado problemas. El mismo patrón apareció, más sutilmente, con los cánceres invasivos luminales A de bajo grado: un aumento de detección del 21 por ciento sin menos cánceres de intervalo posteriores. Las rondas de detección posteriores deberían aclarar si la IA realmente está detectando cánceres peligrosos en forma temprana o simplemente adelantando los diagnósticos en el tiempo sin cambiar los resultados.
Lång se muestra prudente a la hora de implementar la tecnología sin más datos. La introducción de la IA en la atención sanitaria debe hacerse con cautela, afirma, utilizando herramientas probadas y con un seguimiento continuo para garantizar que tengamos buenos datos sobre cómo la IA influye en los diferentes programas de detección regionales y nacionales y cómo eso puede variar con el tiempo. Varios programas de detección en Suecia y Dinamarca ya han implementado sistemas de inteligencia artificial, impulsados en gran medida por la escasez de mano de obra. Se están llevando a cabo otros ensayos aleatorios en Noruega, Australia y el Reino Unido.
La comparación con la tomosíntesis digital de mama (pseudo-mamografía 3D) es instructiva. Un ensayo sueco en el mismo sitio que MASAI encontró tasas de cáncer de intervalo y sensibilidad similares con la tomosíntesis en comparación con la mamografía estándar respaldada por IA, pero con tasas de recuperación más altas y con imágenes que requieren más recursos. La detección estándar respaldada por IA podría ofrecer beneficios similares sin la inversión en infraestructura, aunque la tomosíntesis respaldada por IA podría funcionar aún mejor, si alguien puede hacer que la economía funcione.
Por ahora, la evidencia sugiere que la IA puede mejorar eficientemente el rendimiento de la detección del cáncer de mama en comparación con la práctica estándar. Más estudios sobre futuras rondas de detección y rentabilidad ayudarán a aclarar el equilibrio a largo plazo entre beneficios y daños. Si siguen pareciendo favorables, podría haber argumentos sólidos para implementar la IA en los exámenes de detección basados en la población, especialmente porque los sistemas de salud enfrentan una persistente escasez de personal.
Enlace del estudio: https://www.thelancet.com/journals/lancet/article/PIIS0140-6736(25)02464-X/fulltext
No hay muro de pago aquí
Si nuestros informes lo han informado o inspirado, considere hacer una donación. Cada contribución, sin importar el tamaño, nos permite continuar brindando noticias médicas y científicas precisas, atractivas y confiables. El periodismo independiente requiere tiempo, esfuerzo y recursos; su apoyo garantiza que podamos seguir descubriendo las historias que más le importan.
Únase a nosotros para hacer que el conocimiento sea accesible e impactante. ¡Gracias por estar con nosotros!