En defensa de los LLM en ciencia de datos: lo que ChatGPT puede y no puede hacer por su carrera en ciencia de datos |  de Murtaza Ali |  abril de 2024

Opinión

ChatGPT puede llevar tu juego de ciencia de datos al siguiente nivel, si sabes cómo usarlo.

Una imagen de un científico de datos que usa ChatGPT, generada por ChatGPT.

Cuando ChatGPT salió por primera vez en noviembre de 2022, el LLM (lgrande lidioma METROodel) la locura fue inmensa. Recién salido del laboratorio de Tony Stark, finalmente tuvimos una inteligencia artificial que se comunicaba como un humano. Incluso para los iniciados en la tecnología, sus capacidades fueron impactantes al principio, casi aterradoras. Por supuesto, los LLM ya existían desde hacía algún tiempo, pero GPT-3 llevó las cosas a un nuevo nivel.

Pero entonces, los problemas empezaron a manifestarse. ChatGPT alucina, dijeron los investigadores del aprendizaje automático: a menudo inventaba cosas y citaba “fuentes” que no existían. ChatGPT es un desastre para la integridad académica, advirtieron los especialistas en ética: los estudiantes pueden hacer trampa de manera más fácil que nunca. Y, posiblemente lo más importante, ChatGPT no es éticamente sólido, advirtieron los investigadores de ética de la IA: muchos de sus datos de entrenamiento estaban llenos de sesgos, y esto se refleja en sus respuestas.

Esto lleva a un dilema. ChatGPT es poderoso, sí, ciertamente poder hacer cosas. Pero al mismo tiempo está lejos de ser perfecto. Entonces, ¿deberíamos usarlo? Y si es así, ¿cómo?

Reconozco los argumentos anteriores contra ChatGPT. De hecho, en muchos casos, me encontrarás haciéndolos activamente. Mi propio laboratorio en la Universidad de Washington está lleno de investigaciones sobre la ética de los LLM.

Dicho esto, sostengo que sería una tontería ignorarlos por completo. La tecnología avanza y debemos avanzar con ella. Solo podemos combatir los problemas de los LLM usándolos activamente de manera efectiva para aprender qué se debe cambiar, no ignorándolos por completo.

Cada campo tiene sus propios inconvenientes y beneficios únicos en esta nueva era tecnológica. En este artículo, analizaré tres formas en las que usted, el aspirante a científico de datos, puede aprovechar el poder de ChatGPT. Hablaremos de lo que tu poder hacer y, quizás lo más importante, lo que no poder.

Quiero considerar este dilema desde dos perspectivas diferentes. Primero, daré un ejemplo técnico y luego brindaré una perspectiva más amplia y sutil.