1fuu8smkprwd5qbvgkyom1a.png

O, cuando sientas que tu vida es demasiado difícil, simplemente habla con Claude.

Por soysuwan123

Cuando pienso en los desafíos que implica comprender sistemas complejos, a menudo pienso en algo que sucedió durante mi tiempo en Tripadvisor. Estaba ayudando a nuestro equipo de aprendizaje automático a realizar un análisis para que el equipo de marketing de crecimiento comprendiera qué comportamientos de los clientes predecían un LTV alto. Trabajamos con un talentoso Ph.D. Científico de datos que entrenó un modelo de regresión logística e imprimió los coeficientes como primer paso.

Cuando analizamos el análisis con el equipo de Crecimiento, estaban confundidos: los coeficientes de regresión logística son difíciles de interpretar porque su escala no es lineal y las características que terminaron siendo más predictivas no eran cosas en las que el equipo de Crecimiento pudiera influir fácilmente. . Todos nos acariciamos la barbilla durante un minuto y abrimos un ticket para un análisis de seguimiento, pero como suele suceder, ambos equipos rápidamente pasaron a su siguiente idea brillante. El científico de datos tenía un trabajo de alta prioridad que hacer en nuestro algoritmo de clasificación de búsqueda y, a todos los efectos prácticos, el equipo de Crecimiento arrojó el análisis a la basura.

Todavía pienso en ese ejercicio: ¿Nos rendimos demasiado pronto? ¿Qué pasaría si el circuito de retroalimentación hubiera sido más estrecho? ¿Y si ambas partes hubieran seguido investigando? ¿Qué habría revelado el segundo o el tercer pase?

La anécdota anterior describe una análisis exploratorio eso no aterrizó del todo. El análisis exploratorio es distinto del análisis descriptivo, que simplemente pretende describir lo que está sucediendo. El análisis exploratorio busca obtener una mayor comprensión de un sistema, en lugar de una pregunta bien definida. Considere los siguientes tipos de preguntas que uno podría encontrar en un contexto empresarial:

Observe cómo las preguntas exploratorias son abiertas y apuntan a mejorar la comprensión de un espacio problemático complejo. El análisis exploratorio a menudo requiere más ciclos y una colaboración más estrecha entre el “experto en el dominio” y la persona que realmente realiza el análisis, que rara vez son la misma persona. En la anécdota anterior, la asociación no era lo suficientemente estrecha, los ciclos de retroalimentación no eran lo suficientemente cortos y no dedicamos suficientes ciclos.

Estos desafíos son la razón por la que muchos expertos abogan por un enfoque de “análisis emparejado” para la exploración de datos. Similar a la programación emparejada, análisis emparejado reúne a un analista y a un tomador de decisiones para realizar una exploración en tiempo real. Desafortunadamente, este tipo de asociación estrecha entre analista y toma de decisiones rara vez ocurre en la práctica debido a limitaciones de tiempo y recursos.

Ahora piense en la organización en la que trabaja: ¿qué pasaría si cada persona que toma decisiones tuviera un analista experimentado que lo acompañara? ¿Qué pasaría si tuvieran toda la atención de ese analista y pudieran acribillarlo con preguntas de seguimiento a voluntad? ¿Qué pasaría si esos analistas pudieran cambiar fácilmente de contexto, siguiendo el flujo de conciencia de su socio en una libre asociación de ideas e hipótesis?

Esta es la oportunidad que presentan los LLM en el espacio de análisis: la promesa de que cualquiera puede realizar análisis exploratorios con el beneficio de un analista técnico a su lado.

Echemos un vistazo a cómo esto podría manifestarse en la práctica. El siguiente estudio de caso y demostraciones ilustran cómo un tomador de decisiones con experiencia en el campo podría emparejarse efectivamente con un analista de IA que pueda consultar y visualizar los datos. Compararemos las experiencias de exploración de datos del modelo 4o de ChatGPT con un análisis manual utilizando Tableau, que también servirá como verificación de errores contra posibles alucinaciones.

Una nota sobre la privacidad de los datos: Las demostraciones en vídeo vinculadas en la siguiente sección utilizan conjuntos de datos puramente sintéticos, destinados a imitar patrones comerciales realistas. Para ver notas generales sobre privacidad y seguridad para analistas de IA, consulte Privacidad de datos.

Imagínese esto: usted es el ejecutivo ocupado de un sitio web de comercio electrónico de ropa. Tiene su panel de resumen ejecutivo de KPI predefinidos de alto nivel, pero una mañana echa un vistazo y ve algo preocupante: los ingresos de marketing mes a mes han bajado un 45%, pero no está claro de inmediato por qué.

Tu mente te lleva en diferentes direcciones a la vez: ¿Qué está contribuyendo a la caída de los ingresos? ¿Está aislado de determinados canales? ¿El problema se limita a ciertos tipos de mensajes?

Pero más que eso, ¿qué podemos hacer al respecto? ¿Qué ha funcionado bien últimamente? ¿Qué no funciona? ¿Qué tendencias estacionales vemos en esta época del año? ¿Cómo podemos sacar provecho de ellos?

Para responder a este tipo de preguntas abiertas, deberá realizar un análisis multivariado moderadamente complejo. Este es exactamente el tipo de ejercicio con el que puede ayudar un analista de IA.

Comencemos por echar un vistazo más de cerca a esa preocupante caída en los ingresos mes tras mes.

En nuestro ejemplo, estamos ante una enorme disminución de los ingresos generales atribuidos a las actividades de marketing. Como analista, existen 2 líneas de pensamiento paralelas para comenzar a diagnosticar la causa raíz:

Divida los ingresos generales en múltiples métricas de entrada:

  1. Envío total de mensajes: ¿enviamos menos mensajes?
  2. Tasa de apertura: ¿la gente abría estos mensajes? Es decir, ¿hubo algún problema con los asuntos del mensaje?
  3. Tasa de clics: ¿Era menos probable que los destinatarios hicieran clic en un mensaje? Es decir, ¿hubo algún problema con el contenido del mensaje?
  4. Tasa de conversión: ¿Era menos probable que los destinatarios compraran una vez que hacían clic? Es decir, ¿hubo algún problema con la experiencia de aterrizaje?

Aislar estas tendencias en diferentes dimensiones categóricas

  1. Canales: ¿Se observó este problema en todos los canales o solo en un subconjunto?
  2. Tipos de mensajes: ¿Se observó este problema en todos los tipos de mensajes?

En este caso, en unas pocas indicaciones, el LLM puede identificar una gran diferencia en el tipo de mensajes enviados durante estos dos períodos de tiempo, es decir, la venta del 50 % que se realizó en julio y no en agosto.

Entonces, la caída tiene más sentido ahora, pero no podemos realizar un descuento del 50% todos los meses. ¿Qué más podemos hacer para asegurarnos de aprovechar al máximo nuestros puntos de contacto de marketing? Echemos un vistazo a nuestras campañas de mejor rendimiento y veamos si hay algo, además de las promociones de ventas, que se ubique entre los 10 primeros.

Las herramientas de visualización de datos admiten una interfaz de apuntar y hacer clic para crear visualizaciones de datos. Hoy en día, herramientas como ChatGPT y Julius AI ya pueden replicar fielmente un flujo de trabajo de visualización de datos iterativo.

Estas herramientas aprovechan las bibliotecas de Python para crear y representar visualizaciones de datos estáticos y gráficos interactivos, directamente dentro de la interfaz de usuario del chat. La capacidad de modificar e iterar estas visualizaciones a través del lenguaje natural es bastante sencilla. Con la introducción de módulos de código, representación de imágenes y elementos de gráficos interactivos, la interfaz de chat se acerca al formato familiar de “cuaderno” popularizado por los cuadernos de jupyter.

Con unas pocas indicaciones, a menudo puede configurar una visualización de datos tan rápido como si fuera un usuario avanzado de una herramienta de visualización de datos como Tableau. En este caso, ni siquiera fue necesario consultar los documentos de ayuda para saber cómo funciona Tableau. Gráficos de doble eje obras.

Aquí podemos ver que los mensajes «recién llegados» generan fuertes ingresos por destinatario, incluso con grandes volúmenes de envío:

Entonces, los “recién llegados” parecen estar resonando, pero ¿qué tipos de recién llegados deberíamos asegurarnos de eliminar el próximo mes? Nos acercamos a septiembre y queremos comprender cómo cambian los patrones de compra de los clientes durante esta época del año. ¿Qué categorías de productos esperamos que aumenten? ¿Disminuir?

Nuevamente, con unas pocas indicaciones obtuvimos una visualización de datos clara y precisa, y ni siquiera necesitábamos descubrir cómo usar la complicada función de Tableau. Cálculos rápidos de tablas ¡característica!

Ahora que sabemos qué categorías de productos probablemente aumentarán el próximo mes, es posible que deseemos incluir algunas de nuestras recomendaciones de venta cruzada. Entonces, si la ropa deportiva para hombres va a experimentar el mayor aumento, ¿cómo podemos ver qué otras categorías se compran con mayor frecuencia con esos artículos?

Esto comúnmente se denomina “análisis de la cesta de la compra” y las transformaciones de datos necesarias para realizarlo son un poco complejas. De hecho, hacer un análisis de la cesta de la compra en excel Es efectivamente imposible sin el uso de complementos torpes. Pero con los LLM, todo lo que necesitas hacer es hacer una pausa por un momento y hacer tu pregunta claramente:

«Hola, GPT, para los pedidos que contenían un artículo de ropa exterior deportiva para hombres, ¿qué tipos de productos compra con mayor frecuencia el mismo cliente en el mismo carrito?»

Las demostraciones anteriores ilustran algunos ejemplos de cómo los LLM podrían respaldar una mejor toma de decisiones a escala basada en datos. Los principales actores han identificado esta oportunidad y el ecosistema está evolucionando rápidamente para incorporar LLM en los flujos de trabajo de análisis. Considera lo siguiente:

  • Cuando OpenAI lanzó su versión beta de “intérprete de código” el año pasado, rápidamente cambió el nombre de la función a “Análisis de datos avanzado” para alinearse con la forma en que los primeros usuarios la utilizaban.
  • Con GPT4o, OpenAI ahora admite renderizado gráficos interactivosincluida la capacidad de cambiar la codificación de colores, representar información sobre herramientas al pasar el mouse, ordenar/filtrar gráficos, seleccionar columnas de gráficos y aplicar cálculos.
  • Herramientas como julio.ai están surgiendo para abordar específicamente casos de uso de análisis clave, brindando acceso a múltiples modelos cuando sea apropiado. Julius proporciona acceso a modelos tanto de OpenAI como de Anthropic.
  • Los proveedores están haciendo que compartir datos sea cada vez más fácil, expandiéndose desde la carga de archivos estáticos hasta conectores de Google Sheet y opciones API más avanzadas.
  • Herramientas como Flujo de voz están surgiendo para respaldar el desarrollo de aplicaciones de IA con un enfoque en casos de uso de recuperación de generación aumentada (RAG) (como el análisis de datos). Esto hace que sea cada vez más fácil para los desarrolladores externos conectar conjuntos de datos personalizados a una variedad de LLM de todos los proveedores.

Con esto en mente, tomemos un momento e imaginemos cómo podrían evolucionar los análisis de BI en los próximos 12 a 24 meses. Aquí hay algunas predicciones: