de LLM, gradientes y mecánica cuántica | de Riccardo Di Sipio

de LLM, gradientes y mecánica cuántica | de Riccardo Di Sipio | noviembre de 2024

¿Puede la Computación Cuántica ayudar a mejorar nuestra capacidad para entrenar modelos de lenguaje de codificación (LLM) de grandes redes neuronales?

Foto de Alessio Soggetti (@asoggetti) de Unsplash.com

¿Qué es “entrenamiento”?

En la jerga de los estudios de Inteligencia Artificial (IA), “entrenamiento” significa optimizar un análisis estadístico. modeloa menudo implementado como un red neuronalpara hacer predicciones basadas en algunos datos de entrada y una medida de qué tan buenas son estas predicciones (función de “costo” o “pérdida”). hay tres principales paradigmas en el que dicho procedimiento puede ocurrir: supervisado, sin supervisión (a menudo autorregresivo), y reforzamiento aprendiendo. En supervisado En el aprendizaje, cada punto de datos está etiquetado para que las predicciones del modelo se puedan comparar directamente con los valores verdaderos (p.ej esta es la imagen de un gato o un perro). En sin supervisión entrenamiento, no hay etiquetas explícitas, pero la comparación se realiza con características extraídas de los propios datos (p.ej predecir la siguiente palabra en una oración). Finalmente, reforzamiento el aprendizaje se basa en optimizar los retornos a largo plazo de una secuencia de decisiones (predicciones) basadas en la interacción entre el modelo estadístico y el entorno (¿el coche debe frenar o acelerar en un semáforo en amarillo?).

En todos estos casos, la optimización de la parámetros del modelo Es un proceso largo que requiere un…

de LLM, gradientes y mecánica cuántica | de Riccardo Di Sipio | noviembre de 2024

ByEquipo de 7 minutos

¿Puede la Computación Cuántica ayudar a mejorar nuestra capacidad para entrenar modelos de lenguaje de codificación (LLM) de grandes redes neuronales?

¿Qué es “entrenamiento”?

By Equipo de 7 minutos

Related Post

Lecciones aprendidas después de 8,5 años de aprendizaje automático

Andrew Ng acaba de lanzar OpenWorker: un compañero de trabajo de IA de escritorio local y de código abierto que devuelve entregables terminados en lugar de chatear

Cuando la ciencia de datos nos entristece: la historia de un vuelo con sobreventa

You missed

Lecciones aprendidas después de 8,5 años de aprendizaje automático

Las personas que cancelan planes para estar solas no son antisociales; simplemente pueden tener una lectura más precisa de su propia energía que la que la mayoría de los adultos logran.

¿Acaso España acaba de ser testigo del mismo patrón inquietante sobre el que el Reino Unido ha estado advirtiendo durante años? « Noticias semanales del euro

Tom Schwartz de Vanderpump Rules critica la foto de paparazzi “irreconocible”