Screenshot 2023 11 20 At 11.29.51 Pm.png

ChatGPT ha revolucionado la capacidad de producir fácilmente una amplia gama de texto fluido sobre una amplia gama de temas. ¿Pero qué tan buenos son realmente? Los modelos de lenguaje son propensos a errores fácticos y alucinaciones. Esto permite a los lectores saber si dichas herramientas se han utilizado para escribir artículos de noticias u otros textos informativos al decidir si confiar o no en una fuente. El avance de estos modelos también ha generado preocupaciones sobre la autenticidad y originalidad del texto. Muchas instituciones educativas también han restringido el uso de ChatGPT debido a que el contenido es fácil de producir.

Los LLM como ChatGPT generan respuestas basadas en patrones e información en la gran cantidad de texto en el que fueron capacitados. No reproduce las respuestas palabra por palabra, sino que genera contenido nuevo al predecir y comprender la continuación más adecuada para una entrada determinada. Sin embargo, las reacciones pueden aprovechar y sintetizar información a partir de sus datos de entrenamiento, lo que genera similitudes con el contenido existente. Es importante tener en cuenta que los LLM apuntan a la originalidad y precisión; no es infalible. Los usuarios deben actuar con discreción y no confiar únicamente en el contenido generado por IA para tomar decisiones críticas o situaciones que requieran asesoramiento de expertos.

Existen muchos marcos de detección, como DetectGPT y GPTZero, para detectar si un LLM ha generado el contenido. Sin embargo, el rendimiento de estos marcos falla en conjuntos de datos que originalmente no fueron evaluados. Investigadores de la Universidad de California presentes Cazafantasmas. Es un método de detección basado en búsqueda estructurada y clasificación lineal.

Ghostbuster utiliza un proceso de entrenamiento de tres etapas llamado cálculo de probabilidad, selección de características y entrenamiento de clasificador. En primer lugar, convierte cada documento en una serie de vectores calculando probabilidades por token bajo una serie de modelos de lenguaje. Luego, selecciona características ejecutando un procedimiento de búsqueda estructurado en un espacio de funciones vectoriales y escalares que combinan estas probabilidades definiendo un conjunto de operaciones que combinan estas características y ejecutan la selección de características. Finalmente, entrena un clasificador simple sobre las mejores características basadas en probabilidad y algunas características adicionales seleccionadas manualmente.

Los clasificadores de Ghostbuster están entrenados en combinaciones de características basadas en probabilidad elegidas a través de búsqueda estructurada y siete características adicionales basadas en la longitud de la palabra y las mayores probabilidades de token. Estas otras características pretenden incorporar heurísticas cualitativas observadas sobre el texto generado por IA.

Las mejoras en el rendimiento de Ghostbuster con respecto a los modelos anteriores son sólidas con respecto a la similitud de los conjuntos de datos de entrenamiento y prueba. Ghostbuster logró un promedio de 97,0 F1 en todas las condiciones y superó a DetectGPT en 39,6 F1 y a GPTZero en 7,5 F1. Ghostbuster superó la línea de base de RoBERTa en todos los dominios excepto en escritura creativa fuera del dominio, y RoBERTa tuvo un desempeño fuera del dominio mucho peor. La puntuación F1 es una métrica comúnmente utilizada para evaluar el desempeño de un modelo de clasificación. Es una medida que combina precisión y recuperación en un solo valor y es particularmente útil cuando se trata de conjuntos de datos desequilibrados.


Revisar la Papel y Artículo de blog. Todo el crédito por esta investigación va a los investigadores de este proyecto. Además, no olvides unirte. nuestro SubReddit de 33k+ ML, 41k+ comunidad de Facebook, Canal de discordia, y Boletín electrónicodonde compartimos las últimas noticias sobre investigaciones de IA, interesantes proyectos de IA y más.

Si te gusta nuestro trabajo, te encantará nuestra newsletter.


Arshad es pasante en MarktechPost. Actualmente cursa su carrera internacional. Maestría en Física del Instituto Indio de Tecnología Kharagpur. Comprender las cosas hasta el nivel fundamental conduce a nuevos descubrimientos que conducen al avance de la tecnología. Le apasiona comprender la naturaleza fundamentalmente con la ayuda de herramientas como modelos matemáticos, modelos de aprendizaje automático e inteligencia artificial.