Qué estudiar si quieres obtener un máster en LLM | por Ivo Bernardo | Agosto, 2024

¿Qué conceptos fundamentales debes estudiar si quieres comprender los modelos de lenguaje grandes?

Imagen de solenfeyissa @Unsplash.com

La mayor parte del código que usamos para interactuar con LLM (modelos de lenguaje grandes) está oculto detrás de varias API, y eso es bueno.

Pero si eres como yo y quieres entender el En y salidas De estos modelos mágicos, todavía hay esperanza para ti. Actualmente, además de los investigadores que trabajan en el desarrollo y entrenamiento de nuevos LLM, hay principalmente dos tipos de personas que juegan con este tipo de modelos:

  • Usuarios que interactúan a través de aplicaciones como ChatGPT o Géminis.
  • Científicos de datos y desarrolladores que trabajan con diferentes bibliotecas, como cadena de langosta, índice de llamas o incluso usando Géminis o IA abierta APIs que simplifican el proceso de construcción sobre estos modelos.

El problema es que, y es posible que lo hayas sentido, existe un conocimiento fundamental en minería de texto y procesamiento de lenguaje natural que está completamente oculto en los productos de consumo o las API. Y no me malinterpretes: son excelentes para desarrollar casos de uso interesantes en torno a estas tecnologías. Pero, si quieres tener un conocimiento más profundo para crear casos de uso complejos o manipular los LLM un poco mejor, tendrás que comprobar los fundamentos, en particular cuando los modelos se comportan como tú…