Nota 1: esta publicación es la segunda parte de una serie de tres partes sobre atención médica, gráficos de conocimiento y lecciones para otras industrias. La parte 1, “¿Qué es un gráfico de conocimiento y por qué es importante?” está disponible aquí.
Nota 2: Todas las imágenes por autor.
En la Parte 1, describimos cómo el conocimiento estructurado permitió el progreso de la atención médica. Este artículo examina por qué la atención médica, más que cualquier otra industria, pudo construir esa estructura a escala.
La atención sanitaria es la industria más madura en el uso de gráficos de conocimiento por algunas razones fundamentales. En esencia, la medicina se basa en la ciencia empírica (biología, química, farmacología) que permite establecer una comprensión compartida de los tipos de cosas que existen, cómo interactúan y su causalidad. En otras palabras, la atención sanitaria se presta naturalmente a la ontología.
La industria también se beneficia de una profunda cultura de vocabularios controlados compartidos. Los científicos y los médicos son bibliotecarios natos. Por necesidad, enumeran y clasifican meticulosamente todo lo que pueden encontrar, desde genes hasta enfermedades. Este énfasis en la clasificación se ve reforzado por un compromiso con la observación empírica y reproducible, donde los datos deben ser comparables entre instituciones, estudios y tiempos.
Finalmente, hay fuerzas estructurales que han acelerado la madurez: una regulación estricta; fuerte colaboración precompetitiva; financiación pública sostenida; y estándares de datos abiertos. Todos estos factores incentivan estándares compartidos y conocimiento reutilizable en lugar de modelos propietarios aislados.
Juntos, estos factores crearon las condiciones para que la atención médica construyera una infraestructura semántica compartida y duradera, permitiendo que el conocimiento se acumulara entre instituciones, generaciones y tecnologías.
Ontologías
Los humanos siempre han tratado de entender cómo funciona el mundo. Cuando observamos e informamos lo mismo repetidamente y coincidimos en que es cierto, desarrollamos una comprensión compartida de la realidad. Este proceso se formaliza en la ciencia utilizando el método científico. Los científicos desarrollan una hipótesis, realizan un experimento y evalúan los resultados empíricamente. De esta forma, el ser humano lleva miles de años desarrollando una ontología médica implícita.
Otzi, el hombre de las cavernas descubierto en 1991, que vivió hace 5.300 años, fue descubierto con un hongo antibacteriano en sus calzas, probablemente para tratar su infección por tricocéfalos (Kirsch y Ogas 4). Incluso los cavernícolas tenían cierta comprensión de que las plantas podían usarse para tratar dolencias.
Finalmente, los científicos se dieron cuenta de que no era la planta en sí la que trataba la dolencia, sino los compuestos dentro de la planta, y que podían alterar la estructura molecular de estos compuestos en el laboratorio y hacerlos más fuertes o más efectivos. Este fue el comienzo de la química orgánica y cómo Bayer inventó la aspirina (modificando la corteza de sauce) y la heroína (modificando el opio de las amapolas) (Hager 75; Kirsch y Ogas 69). Esto añadió una nueva clase a la ontología: los compuestos. Con cada nuevo avance científico, nuestra comprensión del mundo natural evolucionó y actualizamos nuestra ontología en consecuencia.
Con el tiempo, la medicina desarrolló una ontología en capas, donde cada nueva clase no reemplazaba a la anterior sino que la ampliaba. La ontología creció hasta incluir patógenos después de que los científicos Fritz Schaudinn y Erich Hoffmann descubrieron que la causa subyacente de la sífilis era una bacteria llamada Treponema pallidum. Aprendimos que los microbios se podían encontrar en casi todas partes y que algunos de ellos podían matar bacterias, como la penicilina, por lo que se agregaron microbios a nuestra teoría.
Aprendimos que el ADN contiene genes que codifican proteínas que interactúan con procesos biológicos y factores de riesgo. Cada avance importante en medicina agregó nuevas clases de cosas a nuestra comprensión compartida de la realidad y nos obligó a razonar sobre cómo interactúan esas clases. Mucho antes de las computadoras, la atención médica ya había construido una ontología en capas. Los gráficos de conocimiento no introdujeron esta forma de pensar; simplemente le dieron un sustrato computacional formal.
Hoy en día, tenemos ontologías para anatomía (Uberon), genes (Gene Ontology), compuestos químicos (ChEBI) y cientos de otros dominios. Repositorios como BioPortal y OBO Foundry brindan acceso a más de mil ontologías biomédicas.
Vocabularios controlados
Una vez que se definió una clase de cosas, la medicina inmediatamente comenzó a nombrar y catalogar cada caso que pudo encontrar. Los científicos son excelentes para catalogar y definir instancias de clases. De materia medica, la primera farmacopea, se completó en el año 70 d.C. Era un libro de unas 600 plantas y unas 1000 medicinas. Cuando los químicos empezaron a trabajar con compuestos orgánicos en el laboratorio, crearon miles de moléculas nuevas que debían catalogarse. En respuesta, en 1881 se publicó el primer volumen del Manual Beilstein de Química Orgánica. Este manual catalogaba todos los compuestos orgánicos conocidos, sus reacciones y propiedades, y creció hasta contener millones de entradas.
Este patrón se repite a lo largo de la historia de la medicina. Cada vez que nuestra comprensión del mundo natural mejoraba y se añadía una nueva clase a la ontología, los científicos comenzaban a catalogar todas las instancias de esa clase. Tras el descubrimiento de Louis Pasteur en 1861 de que los gérmenes causan enfermedades, la gente empezó a catalogar todos los patógenos que pudieron encontrar. En 1923, se publicó la primera versión del Manual de Bacteriología Determinativa de Bergey, que contenía alrededor de mil especies de bacterias únicas.
El mismo patrón se repitió con el descubrimiento de genes, proteínas, factores de riesgo y efectos adversos. Hoy en día, contamos con un rico vocabulario controlado para afecciones y procedimientos (SNOMED CT), enfermedades (ICD 11), efectos adversos (MedDRA), medicamentos (RxNorm), compuestos (CheBI y PubChem), proteínas (UniProt) y genes (NCBI Gene). La mayoría de las grandes empresas farmacéuticas trabajan con docenas de estos vocabularios controlados por terceros.
De manera un tanto confusa, las ontologías y los vocabularios controlados a menudo se combinan en la práctica. Los grandes vocabularios controlados frecuentemente contienen instancias de múltiples clases junto con un modelo semántico liviano (ontología) que las relaciona. SNOMED CT, por ejemplo, incluye casos de enfermedades, síntomas, procedimientos y hallazgos clínicos, así como relaciones definidas formalmente como tiene intención y se debe a. Al hacerlo, combina un vocabulario controlado con una estructura ontológica, funcionando efectivamente como un gráfico de conocimiento por derecho propio.
Reglamentos
Tras un envenenamiento masivo que mató a 107 personas debido a un “elixir” preparado incorrectamente en 1937, el gobierno de Estados Unidos otorgó a la Administración de Alimentos y Medicamentos (FDA) mayores poderes regulatorios (Kirsch 97). La Ley Federal de Alimentos, Medicamentos y Cosméticos de 1938 tenía requisitos sobre cómo se debían etiquetar los medicamentos y exigía que los fabricantes de medicamentos presentaran datos de seguridad y una declaración de “uso previsto” a la FDA. Esto ayudó a Estados Unidos a evitar en gran medida la tragedia de la talidomida a finales de la década de 1950 en Europa, donde se recetaba un tranquilizante a mujeres embarazadas para tratar la ansiedad, los problemas para dormir y las náuseas matutinas, a pesar de que nunca se había probado en mujeres embarazadas. Esto provocó el “mayor desastre médico antropogénico jamás visto”, durante el cual miles de mujeres sufrieron abortos espontáneos y más de 10.000 bebés nacieron con graves deformidades.
Si bien Estados Unidos evitó en gran medida esto debido a la cautela de los revisores de la FDA, también expuso lagunas en el sistema. Las Enmiendas Kekauver-Harris a la Ley Federal de Alimentos, Medicamentos y Cosméticos de 1962 ahora exigían pruebas de que los medicamentos eran seguros y eficaces. La creciente fuerza de la FDA en 1938, y nuevamente en 1962, obligó a la atención médica a estandarizar el significado de los términos. Las compañías farmacéuticas se vieron obligadas a ponerse de acuerdo sobre las indicaciones (para qué está destinado el medicamento), las condiciones (qué trata el medicamento), los efectos adversos (qué otras condiciones se han asociado con este medicamento) y los resultados clínicos. La mayor presión regulatoria también requirió estudios replicables y bien controlados para todas las afirmaciones hechas sobre un medicamento. La regulación no sólo exigía medicamentos más seguros; exigía un significado compartido.
Datos observacionales
Estos cambios regulatorios no solo afectaron los procesos de aprobación; Cambiaron fundamentalmente la forma en que se generaron, estructuraron y compararon las observaciones médicas. Para que la evidencia clínica sea comparable, revisable y replicable, los estándares de datos para ensayos clínicos se codificaron a través de organizaciones como el Consorcio de Estándares de Intercambio de Datos Clínicos (CDISC). CDISC define cómo deben representarse las observaciones clínicas, los criterios de valoración y las poblaciones para la revisión regulatoria. Asimismo, la FDA convirtió las terminologías compartidas catalogadas en vocabularios controlados de mejores prácticas a obligatorias.
Colaboración precompetitiva
Uno de los factores habilitantes que ha llevado a la atención médica a dominar los gráficos de conocimiento es la colaboración precompetitiva. Gran parte del trabajo de la atención sanitaria se basa en ciencias naturales como la biología y la química, que se tratan como un bien público. Las empresas todavía compiten en productos, pero la mayoría considera que una gran parte de su investigación es “precompetitiva”. Organizaciones como la Alianza Pistoia facilitan esta colaboración proporcionando foros neutrales para alinearse en semántica e infraestructura compartidas (consulte la sección de estándares de datos a continuación).
Financiación pública
La financiación pública ha sido esencial para construir la infraestructura del conocimiento en materia de atención sanitaria. Los gobiernos y las instituciones públicas de investigación han invertido mucho en la creación y mantenimiento de ontologías, vocabularios controlados y datos de observación a gran escala que ninguna empresa podría permitirse construir por sí sola. Agencias como los Institutos Nacionales de Salud (NIH) financian muchos de estos activos como bienes públicos, lo que deja a la atención médica con una base de conocimiento rica y abierta lista para conectarse y razonar sobre el uso de gráficos de conocimiento.
Estándares de datos
El sector sanitario también adoptó tempranamente los estándares de datos abiertos, garantizando que el conocimiento compartido pudiera representarse y reutilizarse entre sistemas y proveedores. Los estándares del World Wide Web Consortium (W3C) hicieron que el conocimiento médico fuera legible por máquina e interoperable, lo que permitió compartir modelos semánticos independientemente de cualquier sistema o proveedor. Al anclar el significado en estándares abiertos en lugar de esquemas propietarios, la atención médica permitió que los gráficos de conocimiento funcionaran como una infraestructura compartida y de larga duración en lugar de implementaciones aisladas. Los estándares garantizaron que el significado pudiera sobrevivir a las actualizaciones del sistema, los cambios de proveedores y décadas de cambios tecnológicos.
Conclusión
Ninguno de estos factores por sí solo explica la madurez de la atención sanitaria; es su interacción a lo largo de décadas (ontología que da forma a los vocabularios, regulaciones que hacen cumplir la evidencia, financiamiento que sostiene la infraestructura compartida y estándares que permiten la reutilización) lo que hizo que los gráficos de conocimiento fueran inevitables en lugar de opcionales. Mucho antes de la IA moderna, la atención sanitaria invirtió en acordar qué significan las cosas y cómo se deben interpretar las observaciones. En la parte final de esta serie, exploraremos por qué la mayoría de las otras industrias carecen de estas condiciones y qué pueden tomar prestado de manera realista del camino de la atención médica.
Sobre el autor: Steve Hedden es el jefe de gestión de productos de TopQuadrant, donde dirige la estrategia de EDG, una plataforma para la gestión de metadatos y gráficos de conocimiento. Su trabajo se centra en unir la gobernanza de datos empresariales y la IA a través de ontologías, taxonomías y tecnologías semánticas. Steve escribe y habla regularmente sobre gráficos de conocimiento y el papel cambiante de la semántica en los sistemas de inteligencia artificial.
Bibliografía
Hager, Thomas. Diez medicamentos: cómo las plantas, los polvos y las píldoras han dado forma a la historia de la medicina. Harry N. Abrams, 2019.
Isaacson, Walter. The Code Breaker: Jennifer Doudna, la edición genética y el futuro de la raza humana. Simon y Schuster, 2021.
Kirsch, Donald R. y Ogi Ogas. Los cazadores de drogas: la búsqueda improbable de descubrir nuevas medicinas. Arcada, 2017.