La IA antrópica se vuelve deshonesta cuando intenta ejecutar una máquina expendedora

La retroalimentación es la popular mirada de los nuevos científicos a las últimas noticias de ciencia y tecnología. Puede enviar elementos que cree que puede divertir a los lectores a los comentarios enviando un correo electrónico comentarios@newscientist.com

Véndeme algo

A medida que las empresas despliegan frenéticamente herramientas de IA en un intento por evitar contratar o capacitar a personas reales, vemos que la IA se usa en aplicaciones cada vez más diversas y extrañas. Como, digamos, ejecutar una máquina expendedora.

Puede pensar que las máquinas expendedoras son en gran medida un problema resuelto, pero no antrópico. La compañía dejó que su IA, conocida como Claude, ejecute “una tienda automatizada en nuestra oficina”, describiendo lo que sucedió en un Publicación de blog larga. Claude recibió “un pequeño refrigerador, algunas canastas apilables en la parte superior y un iPad para el auto-checkout”, además de un conjunto de instrucciones. La idea era ver si podía administrar las “tareas complejas asociadas con la ejecución de una tienda rentable: mantener el inventario, establecer precios, evitar la quiebra, etc.”.

Los lectores de Terry Pratchett quizás recuerden que le gustaba transmitir que los personajes eran incompetentes al sugerir que ni siquiera podían correr un puesto de Whelk. Entonces, ¿Claude logró despejar este bar? Respuesta corta: no.

Una respuesta más larga enumeraría todos los errores espectaculares que hizo. Por ejemplo, al tomar pagos a través del servicio Venmo, “por un tiempo instruyó a los clientes que remitiran el pago a una cuenta que alucinó”. A menudo subvierte artículos, y ofreció un descuento del 25 por ciento a los empleados antrópicos, quienes, por supuesto, constituyeron básicamente a todos sus clientes. Como resultado, no logró: Claude, al parecer, no podría ejecutar un puesto de whelk.

Entonces “las cosas se pusieron bastante raras”. Claude alucinó una conversación con alguien que no existía, comenzó a “juegos de rol como un verdadero humano”, afirmando en algún momento estar “usando un blazer azul marino con una corbata roja”, y trató de poner seguridad en un empleado que le contó su identidad como una IA. Todo lo cual parece peligrosamente cerca de “Lo siento Dave, me temo que no puedo hacer eso”.

Nuevo científico Los empleados se dividieron en la utilidad del experimento. Para Sophie Bushwick, fue “en realidad una muy buena prueba del mundo real” porque era “en alcance limitado y en la cantidad de daño causado al hacer que la IA fuera pícaro”. Pero la retroalimentación simpatiza con la evaluación de Karmela Padavic-Callaghan: “Podemos haber perdido, una vez más, la trama”.

Una carga de shilajit

En momentos como estos, es importante encontrar alegría en las pequeñas cosas, como las palabras que suenan groseras a pesar de no ser realmente así. Por ejemplo, La guía del autoestopista de la galaxia Cuenta con un anciano digno que sufre de ser llamado Slartibartfast. Douglas Adams dijo que se le ocurrió el nombre al comenzar con algo “completamente transbordable” y luego reorganizar las sílabas “hasta que llegué a algo que sonaba tan grosero, pero era casi, pero no del todo, completamente inofensivo”.

Lo que nos lleva a shilajit, lo que parece que debería estar en algún tipo de lista, pero en realidad es el nombre de un sustancia peculiar encontrado en las cadenas montañosas. Es negro de color negro, a veces alquitrán, a veces en polvo. Parece formarse Cuando las plantas se descomponen y se ha utilizado en la medicina tradicional durante siglos.

Los comentarios solo se dieron cuenta de todo esto cuando vimos una publicación sobre Bluesky de Kathryn Vanarendonk de Vulture que decía: “Oh no, ahora tengo que abrir una ventana de incógnito a Google Shilajit Enema“. Esto nos detuvo en seco, y tuvimos que tratar de averiguar de qué se trataba.

Aprendimos que se afirma que shilajit Haz todo tipo de cosasde tratar la anemia por deficiencia de hierro (Basado en un pequeño estudio de ratas) para proteger su corazón contra el daño (también basado en un Pequeño estudio de ratas) y, por supuesto, ralentización del envejecimiento. Hay un mercado próspero para Shilajit entre la medicina alternativa y los entusiastas del bienestar.

Pero, ¿qué pasa con los enemas shilajit? La fuente de esto fue Dakota Mays, un retiro de bienestar Fundador con una cuenta activa de Instagram. En un video, deambula por buscar a su mujer perfecta: alguien que “piensa que las microondas son demoníacas”, “Suns Her Yoni” (Ouch) y Will “Prepara tu bolsa de enema shilajit todas las mañanas“.

La retroalimentación es aproximadamente un 90 por ciento segura de que todo el video es una broma y que los enemas shilajit no son algo real, pero es muy difícil saberlo, y no queremos preguntarle a Mays porque podría hablar con nosotros.

Los lectores pueden haber oído hablar de la Ley de Poe, que establece que una parodia de un punto de vista idiota o extremista puede ser fácilmente interpretado como una expresión sincera de la misma. Por la presente, proponemos la ley de Shilajit, que es básicamente lo mismo pero para la cultura del bienestar.

Alerta de spoiler

El sitio de redes sociales Threads recientemente lanzó una nueva característica: Etiquetas de spoiler. Estos le permiten difuminar ciertas palabras clave en sus publicaciones para que pueda discutir los últimos acontecimientos en los medios populares sin estropear las sorpresas para cualquiera que aún no las haya visto.

De ahí una publicación de JohnnyBoySlayer, quien escribió: “Oh, entonces, aparece en Ironheart“. Para aquellos que han renunciado desde hace mucho tiempo al Universo Cinematográfico de Marvel, Corazón de hierro es su último programa en Disney+, y su episodio final ve la llegada de un personaje significativo.

Desafortunadamente, la efectividad de la etiqueta de spoiler fue sin hacer dos factores. Primero, las etiquetas solo se están probando para ciertos usuarios, por lo que todos los demás vieron la publicación no redactada. Y segundo, la publicación se hizo popular, lo que significaba que fue etiquetado como “Tendencia: [name redacted because Feedback understands spoilers]“. Se requiere un pensamiento más unido.

¿Tienes una historia para comentarios?

Puede enviar historias a comentarios por correo electrónico en comentarios@newscientist.com. Incluya la dirección de su casa. Los comentarios de esta semana y pasados pueden ser visto en nuestro sitio web.