Los LLM son más tontos que un gato doméstico.  ¿Pueden reemplazarte de todos modos?  |  de Nabil Alouani |  enero de 2024

No quiero molestar a Sebastian Bubeck en particular, pero si la función de autocompletar con esteroides puede dejarlo boquiabierto, imagine los efectos en el usuario promedio.

Los desarrolladores y profesionales de datos utilizan LLM todos los días para generar código, datos sintéticos y documentación. Ellos también pueden dejarse engañar por capacidades infladas. Los errores ocurren cuando los humanos confían demasiado en sus herramientas.

TL;DR: Esta es una versión anti-bombo en la que comprenderá cómo funcionan los LLM, por qué son tontos y por qué son muy útiles de todos modos, especialmente con un ser humano involucrado.

Si un LLM fuera una carpeta, tendría dos archivos: el primero es un código que puede ejecutar y el segundo es un CSV (una tabla grande) lleno de números.

  1. El código define la estructura de la red neuronal de su modelo y las instrucciones necesarias para ejecutarla. Es como decirle a tu computadora cómo organizarse para realizar cierto tipo de cálculos.
  2. El archivo CSV es una gran lista de números, llamados pesos. Estos pesos determinan cómo se comportan las neuronas dentro de su red neuronal artificial (neuro-net).

Piense en una neurored como un chef que intenta perfeccionar una receta. Cada ingrediente (entrada) puede cambiar drásticamente el sabor del plato (salida).