Evolución de las predicciones de abandono: cómo navegar por las intervenciones y el reciclaje |  de Tomer Alma |  noviembre de 2023

La reentrenamiento de los modelos de abandono presenta desafíos únicos que requieren atención especial

Foto por Corona en desempaquetar

Volver a entrenar los modelos de aprendizaje automático, especialmente aquellos centrados en la predicción de la pérdida de clientes, es un paso esencial para garantizar su relevancia y precisión a lo largo del tiempo. Sin embargo, el reciclaje de modelos de abandono presenta desafíos únicos que requieren atención especial. Entre los más notables está distinguir entre los efectos causales de las intervenciones: identificar a los clientes que se quedaron debido al programa de retención proactiva para dirigirse a ellos exclusivamente.

Considere la siguiente secuencia de eventos:

  1. Formación inicial del modelo: Un modelo se entrena utilizando datos históricos de clientes.
  2. Inferencia del modelo: Ciertos clientes están marcados como propensos a abandonar.
  3. Intervención por parte de empresas: Interactuar con estos clientes para persuadirlos de que se queden o utilizar medidas como promociones y ofertas personalizadas para fomentar la retención.
  4. Reentrenamiento con nuevos datos: Cuando el rendimiento del modelo se degrada, probablemente sea el momento de volver a capacitarse: el modelo se actualiza con datos más recientes, que incluyen los resultados de estas intervenciones.

Imagine un escenario: se prevé que un cliente abandonará, un representante de retención lo tratará y luego se quedará. El desafío surge al intentar explicar el motivo de su decisión: ¿la intervención les hizo cambiar de opinión o, en primer lugar, el modelo los clasificó erróneamente?
Al volver a entrenar el modelo con datos tan ambiguos, existe el riesgo de distorsionar las predicciones futuras del modelo: etiquetar al cliente mencionado anteriormente como “permanecido” podría ser engañoso, ya que podría haberse ido si no lo hubiésemos persuadido de quedarse.
Además de las etiquetas de abandono, una intervención podría ser el único desencadenante del abandono, lo que haría que algunas etiquetas de abandono no fueran confiables.

Cuando los esfuerzos de retención desdibujan la claridad del modelo
  1. Grupos de control y datos sintéticos: Cree un subconjunto de clientes con “probabilidad de abandono” a quienes no se les aplica ninguna intervención. Al comparar los resultados entre este grupo de control y el grupo intervenido, se puede determinar el verdadero impacto de las intervenciones: si un determinado segmento de clientes abandona más cuando recibe tratamiento, se debe examinar su exclusión de la intervención.
    Cuando llega el momento de volver a capacitarse, se pueden utilizar datos del grupo de control y excluir datos del grupo intervenido, asegurando que el modelo se base en etiquetas de abandono confiables.
    La desventaja de este método es la pérdida de datos críticos, por lo que para compensar la exclusión de los clientes intervenidos, se intenta generar muestras sintéticas del grupo de control para representar a esos clientes. Esto se puede hacer por HERIDO entre otras estrategias de sobremuestreo.
  2. Encuestas de retroalimentación: Interactúe directamente con los clientes después de la intervención para comprender sus motivos para quedarse o abandonar. Los conocimientos recopilados pueden proporcionar claridad sobre la eficacia de las intervenciones y ayudar a diferenciar entre los que se quedan genuinamente y los que se dejan llevar por los esfuerzos.
  3. Fusionar modelos: Intente combinar el modelo de formación inicial con el nuevo. Promediar las predicciones o utilizar métodos de conjunto puede reducir el riesgo de que los sesgos de cualquier modelo único dominen la predicción general.
    Tenga en cuenta que a medida que pasa el tiempo, los datos del entrenamiento inicial pueden ser menos relevantes.

A diferencia de los modelos tradicionales de abandono que predicen quién podría irse, Modelado de elevación identificar a los clientes cuyo comportamiento cambia directamente debido a una intervención.
Al comparar el grupo tratado con el grupo de control, estos modelos predicen qué clientes se quedan debido a la intervención y, por otro lado, cuáles se van debido a una intervención.
Este enfoque específico ayuda a las empresas a optimizar los recursos y maximizar el valor para el cliente.

Los clientes se pueden dividir en cuatro categorías teóricas dependiendo de si fueron tratados o no tratados por esfuerzos de retención:
Cosas seguras: Clientes que no abandonarán. Dirigirse a ellos no ofrece retornos adicionales pero agrega costos, como esfuerzos de comunicación y posibles incentivos financieros.
Causas perdidas: Clientes que abandonarán independientemente de las intervenciones. No agregan ingresos y pueden resultar en costos reducidos en comparación con Sure Things, ya que no explotan los incentivos ofrecidos.
persuadibles: Clientes que permanecen solo después del esfuerzo de retención. Aportan ingresos adicionales.
No molestar: Clientes que abandonan solo si son objetivos. No molestarlos es beneficioso, mientras que atacarlos añade costos significativos sin ganancias de ingresos, lo que los convierte en “perros dormidos”.

El objetivo del modelado de elevación es apuntar exclusivamente a los persuadibles.
El desafío es que no podemos determinar en qué categoría caen los individuos. No podemos tratarlos y tenerlos en el grupo de control simultáneamente. Entonces, ¿cómo podríamos identificarlos? ¿Cómo podríamos saber si estaban persuadidos o no tenían intención de abandonar en primer lugar? Aquí es donde interviene el modelado de elevación.

Hay varios enfoques de mejora para este desafío; veremos el método del ‘Resultado transformado’. este método requiere datos tanto de un grupo de control como de un grupo de tratamiento, y cambia nuestro enfoque de una tarea de clasificación a una de regresión.
Las etiquetas se asignan basándose en un fórmula específicay para una asignación de tratamiento aleatoria donde la propensión al tratamiento es igual a 0,5, la variable objetivo se traduce en estos valores:

Las etiquetas de Resultado Transformado (para una propensión al tratamiento del 50%)

Podemos usar una función de pérdida como el error cuadrático medio (MSE) como métrica para resolver este problema de regresión:
Para Persuadables, el control se etiqueta como 0 y el tratado es 2. El MSE más bajo entre ellos será donde la puntuación sea 1, lo que representa el aumento de Persuadables.
Para No molestar, el control es -2 y el tratado es 0, siendo la predicción óptima -1, lo que significa el aumento.
Tanto para las causas perdidas como para los casos seguros, la mejor predicción es 0.
Idealmente, uno debería apuntar a las puntuaciones más altas para tratar de retener a los Persuadables y evitar No Molestar y otros tanto como sea posible.

Como hemos explorado, el panorama de la predicción de la deserción, con sus complejidades de intervenciones y datos en evolución, plantea desafíos para las empresas.
Los modelos de reentrenamiento no son simplemente un ejercicio técnico, sino una parte de comprender el comportamiento del cliente y dar sentido a una retención genuina. Aprovechar herramientas como grupos de control, mecanismos de retroalimentación y modelos de mejora.
Pero quizás lo más crucial sea el reconocimiento de que los datos no son estáticos. Nuestra comprensión del comportamiento del cliente debe adaptarse. Aceptar esta situación dinámica, perfeccionar continuamente los modelos y mantenerse en sintonía con los patrones cambiantes será la clave para una predicción y gestión exitosa de la deserción en el futuro.