Mit Med Segmentation 01 Press.jpg

En biomedicina, la segmentación implica anotar píxeles de una estructura importante en una imagen médica, como un órgano o una célula. Los modelos de inteligencia artificial pueden ayudar a los médicos al resaltar píxeles que pueden mostrar signos de una determinada enfermedad o anomalía.

Sin embargo, estos modelos normalmente sólo proporcionan una respuesta, mientras que el problema de la segmentación de imágenes médicas suele estar lejos de ser blanco y negro. Cinco anotadores humanos expertos podrían proporcionar cinco segmentaciones diferentes, tal vez sin estar de acuerdo sobre la existencia o extensión de los bordes de un nódulo en una imagen de TC de pulmón.

“Tener opciones puede ayudar en la toma de decisiones. Incluso el simple hecho de ver que hay incertidumbre en una imagen médica puede influir en las decisiones de una persona, por lo que es importante tener en cuenta esta incertidumbre”, afirma Marianne Rakic, candidata a doctorado en informática del MIT.

Rakic ​​es el autor principal de un papel con otros en el MIT, el Broad Institute del MIT y Harvard, y el Hospital General de Massachusetts que presenta una nueva herramienta de inteligencia artificial que puede capturar la incertidumbre en una imagen médica.

Conocido como tyche (llamado así por la divinidad griega del azar), el sistema proporciona múltiples segmentaciones plausibles y cada una resalta áreas ligeramente diferentes de una imagen médica. Un usuario puede especificar cuántas opciones genera Tyche y seleccionar la más adecuada para su propósito.

Es importante destacar que Tyche puede abordar nuevas tareas de segmentación sin necesidad de volver a capacitarse. La capacitación es un proceso que requiere un uso intensivo de datos que implica mostrar un modelo con muchos ejemplos y requiere una amplia experiencia en aprendizaje automático.

Debido a que no necesita reentrenamiento, Tyche podría ser más fácil de utilizar para los médicos e investigadores biomédicos que otros métodos. Podría aplicarse «listo para usar» para una variedad de tareas, desde identificar lesiones en una radiografía de pulmón hasta detectar anomalías en una resonancia magnética del cerebro.

En última instancia, este sistema podría mejorar los diagnósticos o ayudar en la investigación biomédica al llamar la atención sobre información potencialmente crucial que otras herramientas de IA podrían pasar por alto.

“La ambigüedad ha sido poco estudiada. Si su modelo omite por completo un nódulo que tres expertos dicen que está ahí y dos expertos dicen que no, probablemente sea algo a lo que deba prestar atención”, añade el autor principal Adrian Dalca, profesor asistente de la Facultad de Medicina de Harvard y el MGH, y un investigador. Científico del Laboratorio de Ciencias de la Computación e Inteligencia Artificial del MIT (CSAIL).

Sus coautores incluyen a Hallee Wong, estudiante de posgrado en ingeniería eléctrica e informática; José Javier González Ortiz PhD ’23; Beth Cimini, directora asociada de análisis de bioimágenes del Broad Institute; y John Guttag, profesor Dugald C. Jackson de Ciencias de la Computación e Ingeniería Eléctrica. Rakic ​​presentará Tyche en la Conferencia IEEE sobre visión por computadora y reconocimiento de patrones, donde Tyche ha sido seleccionado como destacado.

Abordar la ambigüedad

Los sistemas de IA para la segmentación de imágenes médicas suelen utilizar Redes neuronales. Basadas libremente en el cerebro humano, las redes neuronales son modelos de aprendizaje automático que comprenden muchas capas interconectadas de nodos, o neuronas, que procesan datos.

Después de hablar con colaboradores del Broad Institute y del MGH que utilizan estos sistemas, los investigadores se dieron cuenta de que dos problemas importantes limitan su eficacia. Los modelos no pueden capturar la incertidumbre y deben ser reentrenados incluso para una tarea de segmentación ligeramente diferente.

Algunos métodos intentan superar un obstáculo, pero abordar ambos problemas con una única solución ha resultado especialmente complicado, afirma Rakic.

“Si se quiere tener en cuenta la ambigüedad, a menudo hay que utilizar un modelo extremadamente complicado. Con el método que proponemos, nuestro objetivo es hacerlo fácil de usar con un modelo relativamente pequeño para que pueda hacer predicciones rápidamente”, afirma.

Los investigadores construyeron Tyche modificando una arquitectura de red neuronal sencilla.

Un usuario primero le da a Tyche algunos ejemplos que muestran la tarea de segmentación. Por ejemplo, los ejemplos podrían incluir varias imágenes de lesiones en una resonancia magnética del corazón que han sido segmentadas por diferentes expertos humanos para que el modelo pueda aprender la tarea y ver que hay ambigüedad.

Los investigadores descubrieron que sólo 16 imágenes de ejemplo, llamadas «conjunto de contexto», son suficientes para que el modelo haga buenas predicciones, pero no hay límite para la cantidad de ejemplos que se pueden usar. El conjunto de contexto permite a Tyche resolver nuevas tareas sin necesidad de volver a capacitarse.

Para que Tyche capture la incertidumbre, los investigadores modificaron la red neuronal para que genere múltiples predicciones basadas en una entrada de imagen médica y el contexto establecido. Ajustaron las capas de la red para que, a medida que los datos se mueven de una capa a otra, las segmentaciones candidatas producidas en cada paso puedan «hablar» entre sí y con los ejemplos en el conjunto de contexto.

De esta manera, el modelo puede garantizar que las segmentaciones de candidatos sean un poco diferentes, pero aun así resuelvan la tarea.

“Es como tirar los dados. Si tu modelo puede sacar un dos, un tres o un cuatro, pero no sabe que ya tienes un dos y un cuatro, entonces cualquiera de los dos podría aparecer de nuevo”, dice.

También modificaron el proceso de entrenamiento para que se recompense maximizando la calidad de su mejor predicción.

Si el usuario solicita cinco predicciones, al final puede ver las cinco segmentaciones de imágenes médicas que produjo Tyche, aunque una podría ser mejor que las demás.

Los investigadores también desarrollaron una versión de Tyche que se puede utilizar con un modelo existente previamente entrenado para la segmentación de imágenes médicas. En este caso, Tyche permite que el modelo genere múltiples candidatos realizando ligeras transformaciones en las imágenes.

Predicciones mejores y más rápidas

Cuando los investigadores probaron Tyche con conjuntos de datos de imágenes médicas anotadas, descubrieron que sus predicciones capturaban la diversidad de anotadores humanos y que sus mejores predicciones eran mejores que cualquiera de los modelos de referencia. Tyche también funcionó más rápido que la mayoría de los modelos.

“Presentar varios candidatos y asegurarse de que sean diferentes entre sí realmente te da una ventaja”, afirma Rakic.

Los investigadores también vieron que Tyche podría superar a modelos más complejos que han sido entrenados utilizando un gran conjunto de datos especializados.

Para trabajos futuros, planean intentar utilizar un conjunto de contexto más flexible, tal vez incluyendo texto o múltiples tipos de imágenes. Además, quieren explorar métodos que podrían mejorar las peores predicciones de Tyche y mejorar el sistema para que pueda recomendar los mejores candidatos de segmentación.

Esta investigación está financiada, en parte, por los Institutos Nacionales de Salud, el Centro Eric y Wendy Schmidt del Instituto Broad del MIT y Harvard, y Quanta Computer.