Un equipo de investigadores de Stanford Medicine ha presentado SleepFM Clinical, un modelo básico de sueño multimodal que aprende de la polisomnografía clínica y predice el riesgo de enfermedad a largo plazo a partir de una sola noche de sueño. El trabajo de investigación se publica en Nature Medicine y el equipo ha publicado el código clínico como repositorio clínico de código abierto de Sleepfm en GitHub bajo la licencia del MIT.
De la polisomnografía nocturna a una representación general
La polisomnografía registra la actividad cerebral, los movimientos oculares, las señales cardíacas, el tono muscular, el esfuerzo respiratorio y la saturación de oxígeno durante una noche completa en un laboratorio del sueño. Es la prueba de referencia en medicina del sueño, pero la mayoría de los flujos de trabajo clínicos la utilizan sólo para la estadificación del sueño y el diagnóstico de la apnea del sueño. El equipo de investigación trata estas señales multicanal como una densa serie temporal fisiológica y entrena un modelo básico para aprender una representación compartida en todas las modalidades.
SleepFM se entrena con aproximadamente 585.000 horas de grabaciones de sueño de aproximadamente 65.000 personas, extraídas de múltiples cohortes. La cohorte más grande proviene del Centro de Medicina del Sueño de Stanford, donde alrededor de 35.000 adultos y niños se sometieron a estudios nocturnos entre 1999 y 2024. Esa cohorte clínica está vinculada a registros médicos electrónicos, que luego permiten el análisis de supervivencia para cientos de categorías de enfermedades.
Arquitectura del modelo y objetivo de preentrenamiento.
A nivel de modelado, SleepFM utiliza una columna vertebral convolucional para extraer características locales de cada canal, seguida de una agregación basada en la atención entre canales y un transformador temporal que opera en segmentos cortos de la noche. La misma arquitectura central ya apareció en trabajos anteriores sobre SleepFM para la estadificación del sueño y la detección de trastornos respiratorios durante el sueño, donde demostró que aprender la integración de articulaciones en la actividad cerebral, la electrocardiografía y las señales respiratorias mejora el rendimiento posterior.
El objetivo del preentrenamiento es dejar fuera el aprendizaje contrastivo. Para cada segmento de tiempo corto, el modelo construye incorporaciones separadas para cada grupo de modalidad, como señales cerebrales, señales cardíacas y señales respiratorias, y luego aprende a alinear estas incorporaciones de modalidad para que cualquier subconjunto prediga la representación conjunta de las modalidades restantes. Este enfoque hace que el modelo sea robusto ante canales faltantes y montajes de grabación heterogéneos, que son comunes en los laboratorios del sueño del mundo real.
Después del entrenamiento previo en polisomnografía no marcada, la columna vertebral se congela y se entrenan cabezas específicas para tareas pequeñas. Para las tareas de sueño estándar, una cabeza liviana, recurrente o lineal, asigna incrustaciones a las etapas del sueño o etiquetas de apnea. Para la predicción del riesgo clínico, el modelo agrega la noche completa en una sola incorporación a nivel de paciente, concatena datos demográficos básicos como la edad y el sexo y luego introduce esta representación en una capa de riesgos proporcionales de Cox para el modelado del tiempo hasta el evento.
Puntos de referencia sobre la estadificación del sueño y la apnea
Antes de pasar a la predicción de enfermedades, el equipo de investigación verificó que SleepFM compite con modelos especializados en tareas estándar de análisis del sueño. Trabajos anteriores ya demostraron que un clasificador simple además de las incorporaciones de SleepFM supera a las redes convolucionales de extremo a extremo para la clasificación de las etapas del sueño y para la detección de trastornos respiratorios durante el sueño, con ganancias en macro AUROC y AUPRC en varios conjuntos de datos públicos.
En el estudio clínico, se reutiliza la misma columna vertebral previamente entrenada para la estadificación del sueño y la clasificación de la gravedad de la apnea en cohortes multicéntricas. Los resultados informados en el artículo de investigación muestran que SleepFM iguala o supera las herramientas existentes, como los modelos convolucionales tradicionales y otros sistemas automatizados de estadificación del sueño, lo que valida que la representación captura la fisiología central del sueño y no solo artefactos estadísticos de un único conjunto de datos.
Predecir 130 enfermedades y mortalidad con una noche de sueño
La contribución principal de este artículo de investigación de Stanford es la predicción de enfermedades. El equipo de investigación asigna códigos de diagnóstico en los registros médicos electrónicos de Stanford a phecodes y define más de 1000 grupos de enfermedades candidatas. Para cada phecode, calculan el tiempo hasta el primer diagnóstico después del estudio del sueño y ajustan un modelo de Cox sobre las incorporaciones de SleepFM.
SleepFM identifica 130 resultados de enfermedades cuyos riesgos son predecibles a partir de una sola noche de polisomnografía con una fuerte discriminación. Estos incluyen mortalidad por todas las causas, demencia, infarto de miocardio, insuficiencia cardíaca, enfermedad renal crónica, accidente cerebrovascular, fibrilación auricular, varios tipos de cáncer y múltiples trastornos psiquiátricos y metabólicos. Para muchas de estas condiciones, las métricas de desempeño como el índice de concordancia y el área bajo la curva operativa del receptor están en rangos comparables a las puntuaciones de riesgo establecidas, aunque el modelo utiliza sólo registros del sueño más datos demográficos básicos.
El informe también señala que para algunos cánceres, complicaciones del embarazo, afecciones circulatorias y trastornos de salud mental, las predicciones basadas en SleepFM alcanzan niveles de precisión de alrededor del 80 por ciento para ventanas de riesgo de varios años. Esto sugiere que patrones sutiles en la coordinación entre las señales del cerebro, el corazón y la respiración transportan información sobre procesos patológicos latentes que aún no son clínicamente visibles.
Comparación con líneas de base más simples
Para evaluar el valor añadido, el equipo de investigación comparó los modelos de riesgo basados en SleepFM con dos líneas de base. El primero utiliza únicamente características demográficas como la edad, el sexo y el índice de masa corporal. El segundo entrena un modelo de extremo a extremo directamente sobre la polisomnografía y los resultados, sin entrenamiento previo sin supervisión. En la mayoría de las categorías de enfermedades, la representación de SleepFM previamente entrenada combinada con una cabeza de supervivencia simple produce una mayor concordancia y un AUROC de horizonte a largo plazo más alto que ambas líneas de base.
Esta investigación muestra claramente que la ganancia proviene menos de una cabeza de predicción compleja y más del modelo básico que ha aprendido una representación general de la fisiología del sueño. En la práctica, esto significa que los centros clínicos pueden reutilizar una única columna vertebral previamente entrenada, aprender jefes específicos de sitios pequeños con cohortes etiquetadas relativamente modestas y aun así acercarse al rendimiento de vanguardia.
Consulte el documento y los CÓDIGOS COMPLETOS aquí. Además, no dude en seguirnos en Twitter y no olvide unirse a nuestro SubReddit de más de 100.000 ML y suscribirse a nuestro boletín. ¡Esperar! estas en telegrama? Ahora también puedes unirte a nosotros en Telegram.
Consulte nuestra última versión de ai2025.dev, una plataforma de análisis centrada en 2025 que convierte los lanzamientos de modelos, los puntos de referencia y la actividad del ecosistema en un conjunto de datos estructurado que puede filtrar, comparar y exportar.
Asif Razzaq es el director ejecutivo de Marktechpost Media Inc.. Como emprendedor e ingeniero visionario, Asif está comprometido a aprovechar el potencial de la inteligencia artificial para el bien social. Su esfuerzo más reciente es el lanzamiento de una plataforma de medios de inteligencia artificial, Marktechpost, que se destaca por su cobertura en profundidad del aprendizaje automático y las noticias sobre aprendizaje profundo que es técnicamente sólida y fácilmente comprensible para una amplia audiencia. La plataforma cuenta con más de 2 millones de visitas mensuales, lo que ilustra su popularidad entre el público.