No quiero molestar a Sebastian Bubeck en particular, pero si la función de autocompletar con esteroides puede dejarlo boquiabierto, imagine los efectos en el usuario promedio.
Los desarrolladores y profesionales de datos utilizan LLM todos los días para generar código, datos sintéticos y documentación. Ellos también pueden dejarse engañar por capacidades infladas. Los errores ocurren cuando los humanos confían demasiado en sus herramientas.
TL;DR: Esta es una versión anti-bombo en la que comprenderá cómo funcionan los LLM, por qué son tontos y por qué son muy útiles de todos modos, especialmente con un ser humano involucrado.
Si un LLM fuera una carpeta, tendría dos archivos: el primero es un código que puede ejecutar y el segundo es un CSV (una tabla grande) lleno de números.
- El código define la estructura de la red neuronal de su modelo y las instrucciones necesarias para ejecutarla. Es como decirle a tu computadora cómo organizarse para realizar cierto tipo de cálculos.
- El archivo CSV es una gran lista de números, llamados pesos. Estos pesos determinan cómo se comportan las neuronas dentro de su red neuronal artificial (neuro-net).
Piense en una neurored como un chef que intenta perfeccionar una receta. Cada ingrediente (entrada) puede cambiar drásticamente el sabor del plato (salida).