Caracterizada por una musculatura cardíaca debilitada o dañada, la insuficiencia cardíaca provoca la acumulación gradual de líquido en los pulmones, las piernas, los pies y otras partes del cuerpo del paciente. La afección es crónica e incurable y a menudo provoca arritmias o paro cardíaco repentino. Durante muchos siglos, las sangrías y las sanguijuelas fueron el tratamiento de elección, practicado famosamente por los barberos en Europa, durante una época en la que los médicos rara vez operaban a los pacientes.
En el siglo XXI, el tratamiento de la insuficiencia cardíaca se ha vuelto decididamente menos medieval: hoy en día, los pacientes se someten a una combinación de cambios saludables en el estilo de vida, prescripción de medicamentos y, en ocasiones, uso de marcapasos. Sin embargo, la insuficiencia cardíaca sigue siendo una de las principales causas de morbilidad y mortalidad, lo que supone una carga sustancial para los sistemas de atención sanitaria de todo el mundo.
“Aproximadamente la mitad de las personas diagnosticadas con insuficiencia cardíaca morirán dentro de los cinco años posteriores al diagnóstico”, dice Teya Bergamaschi, estudiante de doctorado del MIT en el laboratorio de Nina T. y Robert H. Rubin, profesor Collin Stultz y coautor principal de un nuevo artículo que presenta un modelo de aprendizaje profundo para predecir la insuficiencia cardíaca. “Comprender cómo le irá a un paciente después de la hospitalización es realmente importante a la hora de asignar recursos finitos”.
El artículo, publicado en Lancet eClinical Medicine por un equipo de investigadores del MIT, Mass General Brigham y la Escuela de Medicina de Harvard, comparte los resultados del desarrollo y prueba de PULSE-HF, que significa “Predecir cambios en la función sistólica del ventrículo izquierdo a partir de ECG de pacientes con insuficiencia cardíaca”. El proyecto se llevó a cabo en el laboratorio de Stultz, afiliado a la Clínica Abdul Latif Jameel de Aprendizaje Automático en Salud del MIT. Desarrollado y probado retrospectivamente en tres cohortes diferentes de pacientes del Hospital General de Massachusetts, el Hospital Brigham and Women’s y MIMIC-IV (un conjunto de datos disponible públicamente), el modelo de aprendizaje profundo predice con precisión los cambios en la fracción de eyección del ventrículo izquierdo (FEVI), que es el porcentaje de sangre que se bombea fuera del ventrículo izquierdo del corazón.
Un corazón humano sano bombea entre el 50 y el 70 por ciento de la sangre del ventrículo izquierdo con cada latido; cualquier cantidad inferior se considera un signo de un problema potencial. “El modelo toma una [electrocardiogram] y genera una predicción de si habrá o no una fracción de eyección durante el próximo año que caiga por debajo del 40 por ciento”, dice Tiffany Yau, estudiante de doctorado del MIT en el laboratorio de Stultz y también coautora del artículo PULSE-HF. “Ese es el subgrupo más grave de insuficiencia cardíaca”.
Si PULSE-HF predice que es probable que la fracción de eyección de un paciente empeore dentro de un año, el médico puede priorizar al paciente para el seguimiento. Posteriormente, los pacientes de menor riesgo pueden reducir el número de visitas al hospital y el tiempo dedicado a adherir 10 electrodos a su cuerpo para un ECG de 12 derivaciones. El modelo también se puede implementar en entornos clínicos de bajos recursos, incluidos consultorios médicos en áreas rurales que normalmente no cuentan con un ecografista cardíaco para realizar ultrasonidos a diario.
“Lo más importante que distingue [PULSE-HF] A diferencia de otros métodos de ECG para la insuficiencia cardíaca, en lugar de detectarlo, hace pronósticos”, afirma Yau. El artículo señala que hasta la fecha no existen otros métodos para predecir la futura disminución de la FEVI en pacientes con insuficiencia cardíaca.
Durante el proceso de prueba y validación, los investigadores utilizaron una métrica conocida como “área bajo la curva característica operativa del receptor” (AUROC) para medir el rendimiento de PULSE-HF. AUROC se utiliza normalmente para medir la capacidad de un modelo para discriminar entre clases en una escala de 0 a 1, donde 0,5 es aleatorio y 1 es perfecto. PULSE-HF logró AUROC que oscilaron entre 0,87 y 0,91 en las tres cohortes de pacientes.
En particular, los investigadores también construyeron una versión de PULSE-HF para ECG de una sola derivación, lo que significa que solo es necesario colocar un electrodo en el cuerpo. Si bien los ECG de 12 derivaciones generalmente se consideran superiores por ser más completos y precisos, el rendimiento de la versión de una sola derivación de PULSE-HF fue tan sólido como el de la versión de 12 derivaciones.
A pesar de la elegante simplicidad detrás de la idea de PULSE-HF, como la mayoría de las investigaciones clínicas de IA, oculta una ejecución laboriosa. “Han tardado años [to complete this project]”, recuerda Bergamaschi. “Ha pasado por muchas iteraciones”.
Uno de los mayores desafíos del equipo fue recopilar, procesar y limpiar los conjuntos de datos de ECG y ecocardiogramas. Si bien el modelo tiene como objetivo pronosticar la fracción de eyección de un paciente, las etiquetas de los datos del entrenamiento no siempre estuvieron disponibles. Al igual que un estudiante aprende de un libro de texto con una clave de respuestas, el etiquetado es fundamental para ayudar a los modelos de aprendizaje automático a identificar correctamente patrones en los datos.
El texto limpio y lineal en forma de archivos TXT suele funcionar mejor al entrenar modelos. Pero los archivos de ecocardiograma generalmente vienen en forma de PDF, y cuando los PDF se convierten a archivos TXT, el texto (que se divide mediante saltos de línea y formato) se vuelve difícil de leer para el modelo. La naturaleza impredecible de los escenarios de la vida real, como un paciente inquieto o una pista suelta, también estropeó los datos. “Hay muchos artefactos de señal que es necesario limpiar”, afirma Bergamaschi. “Es una especie de madriguera de conejo sin fin”.
Si bien Bergamaschi y Yau reconocen que métodos más complicados podrían ayudar a filtrar los datos para obtener mejores señales, la utilidad de estos enfoques tiene un límite. “¿En qué momento te detienes?” pregunta Yau. “Hay que pensar en el caso de uso: ¿es más fácil tener este modelo que funcione con datos ligeramente confusos? Porque probablemente lo será”.
Los investigadores anticipan que el siguiente paso para PULSE-HF será probar el modelo en un estudio prospectivo en pacientes reales, cuya futura fracción de eyección se desconoce.
A pesar de los desafíos inherentes a llevar herramientas clínicas de IA como PULSE-HF a la meta, incluido el posible riesgo de prolongar el doctorado un año más, los estudiantes sienten que los años de arduo trabajo valieron la pena.
“Creo que las cosas son gratificantes en parte porque son desafiantes”, dice Bergamaschi. “Un amigo me dijo: ‘Si crees que encontrarás tu vocación después de graduarte, si tu vocación es realmente una vocación, estará allí durante el año adicional que te lleve graduarte’. … La forma en que se nos mide como investigadores en [the ML and health] El espacio es diferente de otros investigadores en el espacio ML. Todos en esta comunidad comprenden los desafíos únicos que existen aquí”.
“Hay demasiado sufrimiento en el mundo”, dice Yau, quien se unió al laboratorio de Stultz después de que un evento de salud le hiciera darse cuenta de la importancia del aprendizaje automático en la atención médica. “Cualquier cosa que intente aliviar el sufrimiento es algo que consideraría un uso valioso de mi tiempo”.