Por qué he cambiado de opinión sobre la IA y tú también deberías hacerlo

Es hora de repensar nuestra relación con la IA

Flavio Coelho/Getty Images

Es innegable que el lanzamiento de ChatGPT fue un evento de importancia histórica, pero ¿es porque fue el primer paso glorioso hacia un futuro superinteligente o porque fue el comienzo de un mundo lleno de vendedores de aceite de serpiente de IA? Durante mucho tiempo he pensado que los grandes modelos de lenguaje, la tecnología detrás de los chatbots de IA, son fascinantes pero defectuosos, lo que me coloca firmemente en el campo del aceite de serpiente. Pero una semana dedicada a codificar vibraciones ha revelado algo sorprendente: tanto los impulsores como los escépticos están equivocados.

Primero, debería explicarlo. La codificación Vibe, si no está familiarizado, es un término acuñado hace aproximadamente un año por Andrej Karpathy, un investigador de IA que cofundó y trabajó anteriormente en OpenAI. Se refiere al proceso de desarrollar software “vibrando” con un modelo de IA, instruyéndolo en un lenguaje sencillo mientras le permite generar el código real. Recientemente, he visto a gente decir que las últimas herramientas (Claude Code y ChatGPT Codex) se han vuelto sorprendentemente buenas en codificación, como en un artículo del New York Times titulado “Ha llegado la disrupción de la IA que estábamos esperando”.

Decidí experimentar con estas herramientas y quedé asombrado con los resultados. En tan solo unos pocos días, con una experiencia limitada en codificación, he creado aplicaciones personalmente útiles, como un selector de audiolibros que verifica lo que está disponible en mi biblioteca local, y una aplicación combinada de cámara y teleprompter que se ejecuta en mi teléfono.

Puede que esto le suene aburrido, y está perfectamente bien, por razones que explicaré más adelante. Lo importante aquí es que este proceso me ha permitido involucrarme más profundamente con productos como ChatGPT que antes. Anteriormente, probé experimentos menores, me disgustaron la escritura genérica, la adulación o los resultados de búsqueda inexactos, y reboté. Para estos nuevos proyectos de codificación, mi uso prolongado me hizo darme cuenta de algo que no había hecho antes: la forma en que se han producido los LLM produce una máquina que estoy destinado a odiar.

Muy pocos de nosotros hemos estado expuestos a un LLM “en bruto”, es decir, un modelo estadístico que ha sido entrenado con una gran colección de datos para producir un texto plausiblemente representativo. En cambio, la mayoría de nosotros utilizamos tecnología que ha sido mediada a través de un proceso llamado aprendizaje por refuerzo a partir de la retroalimentación humana (RLHF). Las empresas de inteligencia artificial utilizan humanos para calificar el texto producido por un LLM sin procesar, recompensando las respuestas que se perciben como seguras, útiles y atractivas, mientras penalizan el contenido dañino o las respuestas que probablemente desalienten a la mayoría de los usuarios de interactuar con sus productos.

Es este proceso RLHF el que produce la “voz del chatbot” genérica con la que probablemente esté familiarizado. Es un proceso que se integra en los valores implícitos del productor, desde una actitud general de “moverse rápido y romper cosas” en Silicon Valley hasta la ideología más específica de Grok, el controvertido chatbot X, infundida por Elon Musk.

Actualmente, es muy difícil lograr que un chatbot exprese incertidumbre, contradiga al usuario o detenga el impulso. Esto se volvió más obvio para mí cuando encontré un problema irresoluble con mi teleprompter. Había estado intentando crear una aplicación que superpusiera texto en mi aplicación de cámara existente, asumiendo que sería más fácil que crear una cámara desde cero, pero el código que ChatGPT estaba produciendo seguía fallando. En repetidas ocasiones sugirió soluciones, instándome a seguir adelante con el proyecto. Fue sólo cuando me di cuenta de que las complejidades del sistema operativo Android, con las que no los aburriré, significaban que crear una aplicación todo en uno sería mucho más fácil. Tan pronto como le pedí a ChatGPT que produjera esto, funcionó al instante.

Aprendiendo de esto, comencé a instruir a ChatGPT para que se cuestionara constantemente tanto a sí mismo como a mí. Exigí un escepticismo vigilante. “Jacob quiere que el asistente utilice por defecto el análisis primero de la evidencia: evite la extrapolación, marque explícitamente la inferencia frente a la evidencia y prefiera indicar la incertidumbre o detenerse cuando la evidencia es escasa, a menos que el usuario pida especulaciones”, es solo uno de los marcos (generados por él mismo) que he impuesto en su memoria. En otras palabras, construí un modelo diseñado exclusivamente para trabajar con mi perfil psicológico, separando cuidadosamente los valores de OpenAI y reemplazándolos por los míos.

No es perfecto. Es muy difícil para un LLM luchar contra su capacitación RLHF y el incumplimiento sigue filtrándose. Pero lo que esto significa es que ahora tengo una herramienta que sirve como un espejo cognitivo algo útil. No lo usé para escribir este artículo, porque su estilo de escritura sigue siendo terriblemente turgente y porque New Scientist, con razón, tiene reglas estrictas contra la copia generada por IA, pero lo usé para pensar en este artículo. Le pedí a mi espejo cognitivo que investigara argumentos y contraargumentos, rechazando muchas de sus conclusiones por falsas o espurias. Extraje valor, pero requirió precaución y trabajo, no dejar que la IA hiciera el trabajo pesado. Lo más importante es que mi cerebro permaneció plenamente activo en todo momento.

Esto me lleva a reforzar una conclusión a la que ya había llegado: interactuar con la producción de IA de otra persona es, en casi todos los casos, funcionalmente inútil. No se puede obtener nada del texto generado por IA que no se recibiría mejor si usted mismo solicitara una IA. También sigo refutando la idea de que la IA sea realmente inteligente de alguna manera; en cambio, considero que los LLM son una ayuda cognitiva, como una calculadora o un procesador de textos. Con este planteamiento, como herramienta privada, no como máquina de conquistar el mundo, ahora veo el beneficio. Por esa razón, es correcto que no te importe mi aplicación de teleprompter. Lo que debería entusiasmarle es la posibilidad de resolver sus propios problemas a su manera.

Aquí es donde nuestro paradigma actual de IA introduce otro problema. En mi opinión, el mejor LLM sería aquel que se ejecute en su propia computadora, sin conexión a una corporación privada. Debe tratarse como una herramienta experimental peligrosa sobre la que usted tiene control total. Me acuerdo del meme de que los ingenieros de software mantienen un arma cargada al lado de su impresora, en caso de que haga un ruido que no reconozcan. Lamentablemente, actualmente no es posible ejecutar su propio LLM de vanguardia por una variedad de razones, entre ellas que el auge de la IA está elevando los precios del hardware que necesita.

También debo abordar el pecado original de los LLM: la posible infracción de derechos de autor. Por diseño, esta tecnología sólo puede construirse a partir de datos ingeridos a gran escala, esencialmente todo el registro textual de la humanidad. Es innegable que empresas como OpenAI construyeron sus modelos utilizando texto protegido por derechos de autor sin permiso, aunque si esto fue realmente ilegal es tema de casos judiciales en curso. Un LLM privado tendría los mismos problemas, pero puedo ver soluciones, como modelos del sector público, efectivamente perdonados por los gobiernos y distribuidos gratuitamente en beneficio de todos, no de las corporaciones privadas. También sigo preocupado por el impacto ambiental de los centros de datos, pero nuevamente esto podría mitigarse en parte con una distribución más amplia de LLM que se ejecuten en nuestras propias máquinas.

Acepto que algunas personas que lean esto me acusarán de haberme vendido a los técnicos. Todo lo que puedo decir al respecto es que no he revisado mi postura de larga data sobre los LLM como una tecnología fascinante, peligrosa y, en ocasiones, extraordinaria.

Lo que me he dado cuenta es que la forma principal en la que interactuamos con la tecnología, a través de ingeniosos chatbots como ChatGPT, es donde entra gran parte del daño y se permite que se extienda al mundo. Los LLM no deberían establecerse ni convertirse en productos, ni imponerse en cada aspecto de nuestras vidas con un emoji brillante que quiera ser tu amigo. Sería mucho mejor si usáramos estas herramientas con atención, con mayor fricción y plena conciencia y precaución contra el daño potencial que pueden causar. Aquí, una metáfora útil asoma su cabeza con colmillos. No quiero el aceite de serpiente de OpenAI. Quiero serpientes.

Temas: