SERIE NED
Cómo extraer conocimiento de textos biomédicos combinando modelos de lenguaje previamente entrenados con aprendizaje automático de gráficos
Este artículo sintetiza un artículo aceptado por el IEEE. Aplicación de las Tecnologías de la Información y las Comunicaciones (AICT2024) conferencia. Además del abajo firmante, Felice Paolo Colliani (primer autor), Giovanni Garifo, Antonio Vetròy Juan Carlos De Martín son los coautores de este artículo.
El dominio biomédico ha experimentado una tasa de publicación en constante aumento a lo largo de los años debido al crecimiento de la investigación científica, los avances en la tecnología y el énfasis global en la atención médica y la investigación médica.
La aplicación de técnicas de procesamiento del lenguaje natural (PNL) en el ámbito biomédico representa un cambio en el análisis y la interpretación del vasto corpus de conocimiento biomédico, mejorando nuestra capacidad de derivar conocimientos significativos a partir de datos textuales.
La desambiguación de entidades nombradas (NED) es una tarea crítica de PNL que implica resolver ambigüedades en las menciones de entidades vinculándolas a las entradas correctas en una base de conocimiento. Para comprender la importancia y complejidad de dicha tarea, considere el siguiente ejemplo:
Zika Pertenece a la familia Flaviviridae y se transmite por el mosquito Aedes.
Individuos afectados por Zika infección a menudo…