0rqrm4e0ma26s814v.jpeg

GLiNER es un modelo NER que puede identificar cualquier tipo de entidad utilizando un codificador transformador bidireccional (similar a BERT) que supera a ChatGPT y otros LLM en tareas de clasificación de tokens de disparo cero.

Foto por Matt Hardy en desempaquetar

Quienes han trabajado en el pasado con el paradigma NER (reconocimiento de entidades nombradas) conocen bien el valor de tener un modelo de desempeño para la tarea en la que se ha entrenado.

De hecho, Los modelos NER son extremadamente útiles para tareas de minería de datos y análisis textual. – son la base de cada tarea de inteligencia digital y en innumerables tareas vinculadas a procesos de ciencia de datos más grandes y complejos.

Quienes hacen NER también saben lo complejo que es entrenar un modelo de este tipo debido a la enorme cantidad de etiquetas que se deben especificar durante la fase de entrenamiento. Bibliotecas como SpaCy y los modelos Hugging Face basados ​​en transformadores han ayudado enormemente a los científicos de datos a desarrollar modelos NER de una manera cada vez más eficiente, lo que aún mejora el proceso hasta cierto punto.

En este artículo analizaremos juntos los Paradigma GLiNER, una nueva técnica de extracción de entidades que combina el paradigma NER clásico con el poder de los LLM.