La variación genética es la base de la diversidad humana y permite diferencias en rasgos como la altura, el color de ojos o el tipo de sangre. Algunas variantes de secuencia también causan enfermedades hereditarias, como anemia falciforme, fibrosis quística y mucopolisacaridosis tipo III. Sin embargo, a los científicos a menudo les resulta difícil identificar qué variantes son responsables de una condición patológica.

En este foco de innovación, Yuya Kobayashicientífico genómico clínico de Invitae, analiza cómo los genetistas clínicos clasifican y reclasifican variantes y cómo la inteligencia artificial (IA) ayuda a mejorar las pruebas genéticas.

Yuya Kobayashidoctorado
Gerente sénior de programas
Sistemas de clasificación de variantes
invita

¿Cuál es el marco general utilizado para clasificar las variantes genéticas?

En 2015, el Colegio Americano de Genética y Genómica Médica (ACMG) y la Asociación de Patología Molecular (AMP) directrices de consenso conjunto publicadas para clasificar variantes genéticas de la línea germinal.1 Estas recomendaciones, conocidas como directrices del ACMG, proporcionan un enfoque estandarizado para que los genetistas clínicos determinen si existe evidencia suficiente para clasificar una variante como patógena o benigna.

Las directrices del ACMG establecieron tres parámetros. En primer lugar, definió los tipos de pruebas que debían considerarse. En segundo lugar, estableció el valor o peso de cada pieza de evidencia y cómo combinarlas para alcanzar uno de cinco niveles de clasificación: patógeno, probablemente patógeno, variante de significado incierto (VUS), probablemente benigno o benigno. Finalmente, las directrices designaron umbrales de confianza objetivo para cada uno de esos niveles, con un 90 por ciento de confianza como umbral para clasificar variantes como probablemente patógenas o probablemente benignas.

En nuestro reciente Red JAMA abierta estudiarutilizamos datos históricos de clasificación de variantes de más de dos millones de variantes genéticas durante un período de ocho años para determinar qué tan bien se alineaba el sistema de clasificación de variantes actual con estos objetivos de umbral de confianza.2 Al observar cómo evolucionó la clasificación de una variante con el tiempo, podríamos estimar la precisión de las clasificaciones originales.

¿Qué es Sherloc y qué tan precisas son sus clasificaciones de variantes?

sherloc (reglas semicuantitativas, jerárquicas y basadas en evidencia para la interpretación del locus) es un sistema de clasificación de variantes clínicamente validado, revisado por pares y que cumple con las pautas del ACMG que define cómo aplicar las pautas del ACMG de una manera más concreta y granular.3 Por ejemplo, las directrices del ACMG establecen que una variante que sea más frecuente en la población general de lo esperado para una enfermedad debe clasificarse como benigna, pero no define qué se debe esperar. Un sistema como Sherloc llena esos vacíos con herramientas analíticas y reglas definidas por los genetistas. Es importante destacar que Sherloc es un sistema que puede evolucionar con el tiempo a medida que mejora nuestro conocimiento de la genética y la tecnología disponible.

Los dos millones de variantes de nuestro estudio habían sido clasificado usando Sherlocpor lo que examinar cómo esas clasificaciones cambiaron con el tiempo nos dio una manera de estimar la precisión de sus clasificaciones iniciales.2 Nuestros hallazgos muestran que cuando Sherloc clasifica una variante como probablemente patógena o probablemente benigna, los nuevos datos la confirman el 99,9 por ciento de las veces. Esto sugiere que la precisión lograda por un sistema que cumple con las directrices del ACMG, como Sherloc, supera con creces el objetivo de confianza del 90 por ciento establecido por ACMG/AMP.

¿Por qué es necesaria la reclasificación de variantes genéticas en genómica clínica?

El genoma humano tiene aproximadamente tres mil millones de pares de bases de longitud, lo que significa que hay muchas variantes genéticas posibles, y cualquier variante dada tiene una baja probabilidad de haber sido bien estudiada u observada ampliamente. A menudo tenemos datos limitados sobre una variante genética y, como resultado, aproximadamente la mitad de las variantes genéticas encontradas se clasifican inicialmente como VUS. Sin embargo, a medida que más pacientes se someten a pruebas y mejora la metodología de los estudios experimentales, nuevos datos nos permiten reevaluar variantes previamente clasificadas.

Nuestro estudio encontró que casi todas las reclasificaciones Confirmó las variantes probablemente patógena y probablemente benigna como patógena y benigna, respectivamente, o convirtió una VUS a una clasificación más definitiva.2 De acuerdo con otros estudios, alrededor del 80 por ciento de los VUS reclasificados terminaron como probablemente benignos o benignos. Sólo en casos muy raros, alrededor del 0,06 por ciento de las reclasificaciones, vimos situaciones en las que nueva evidencia revirtió la clasificación original (por ejemplo, de benigno a patógeno, o viceversa).

Un resultado de VUS puede resultar frustrante porque no ofrece al paciente ni al médico una respuesta viable. Estas reclasificaciones podrían significar la oportunidad de recibir regímenes o tratamientos de vigilancia adecuados. En algunos casos, una reclasificación puede ofrecer tranquilidad al paciente al confirmar un resultado benigno y reducir las intervenciones médicas innecesarias. En última instancia, la capacidad de proporcionar un resultado más definitivo allana el camino para la medicina de precisión, lo que conduce a una atención dirigida más adecuada.

¿Qué enfoques ayudaron a reclasificar las VUS en categorías definitivas?

Una ilustración de una molécula de ADN que emerge de una placa de circuito.

En su nuevo estudio, Kobayashi y sus colegas determinaron que la mayoría de las reclasificaciones de VUS fueron el resultado de que los científicos aprovecharan las herramientas de aprendizaje automático para volver a analizar conjuntos de datos existentes.

Nuestro estudio identificó tres estrategias principales que contribuyó a la reclasificación de VUS.2 La primera estrategia fue confiar en nuevos datos recopilados de pruebas de pacientes adicionales o conjuntos de datos disponibles públicamente, lo que contribuyó al 30 por ciento de las reclasificaciones de VUS. La segunda estrategia implicó generar datos con el propósito de resolver VUS, como probar a miembros adicionales de la familia para realizar análisis de segregación o probar el ARN de un paciente para comprender mejor el impacto molecular de las variantes. Esta estrategia representó el 10 por ciento de las reclasificaciones.

Sorprendentemente, la causa principal de la reclasificación de VUS no fue el resultado de nuevos datos sino la aplicación del aprendizaje automático (ML) para volver a analizar los datos existentes. Estas herramientas de ML nos permitieron medir con mayor precisión la importancia de cada pieza de evidencia, lo que a su vez nos ayudó a llegar a una conclusión más definitiva. Es importante destacar que los enfoques de aprendizaje automático que tuvieron un impacto significativo en las reclasificaciones de VUS fueron los desarrollados conjuntamente por genetistas clínicos, que tienen un profundo conocimiento de las complejidades de los datos, y científicos de inteligencia artificial.

¿Qué implicaciones tienen sus hallazgos para el avance de las prácticas de pruebas genéticas?

El hallazgo clave de nuestro estudio es que la precisión de las clasificaciones de variantes actuales es generalmente extremadamente alta y excede las definiciones objetivo establecidos por las directrices del ACMG.2 Sin embargo, esto implica que un número significativo de variantes se están clasificando como VUS, a pesar de exceder el objetivo de confianza del 90 por ciento para probablemente benignas y probablemente patógenas. Esta brecha resalta la necesidad de mejorar la comunicación sobre el grado de confianza en los resultados de las pruebas genéticas y una mejor comprensión de cómo deben manejarse en la atención clínica.

El otro hallazgo notable es que incluso con estos estándares estrictos para una clasificación que no es VUS, hemos logrado avances sustanciales en la reducción de VUS, particularmente entre grupos raciales, étnicos y de ascendencia históricamente subrepresentados, con las herramientas de aprendizaje automático como impulsor clave. Este hallazgo sugiere que las herramientas de aprendizaje automático podrían proporcionar un camino hacia la mejora de la equidad en las pruebas genéticas. Sin embargo, a pesar de todos los avances que hemos logrado, nueve de cada diez variantes clasificadas como VUS permanecen sin cambios a día de hoy. La innovación continua en el análisis de datos, incluido el uso de ML y otros enfoques de IA, será esencial para acelerar el progreso y mejorar la equidad en las pruebas genéticas.

¿Cuáles son los próximos pasos para mejorar los procesos y directrices para la clasificación de variantes en las pruebas genéticas de la línea germinal?

El objetivo al que aspira nuestra comunidad ha sido eventualmente hacer la transición a un marco de clasificación cuantitativa que pueda generar la probabilidad de patogenicidad de una variante, en lugar de depender de las clasificaciones cualitativas de cinco niveles que utilizamos hoy. Tal cambio podría eludir el desafío de armonizar la precisión de la clasificación observada con la precisión buscada.

Las tecnologías de IA y ML están preparadas para desempeñar un papel importante en esta transición, como lo demuestra su impacto positivo observado en nuestro estudio. Sin embargo, es fundamental que los genetistas clínicos guíen el desarrollo y la implementación de sistemas impulsados ​​por IA para garantizar que se utilicen de forma cuidadosa y adecuada. Establecer directrices sobre cómo se deben validar e incorporar las herramientas de IA en entornos clínicos será el siguiente paso fundamental para avanzar en las prácticas de pruebas genéticas, haciéndolas más precisas y accesibles para todos los pacientes y médicos.

Innovación destacada

Por automata