Modelado de Temas en Inteligencia de Negocios: FASTopic y BERTopic en Código | de Petr Korab | enero de 2025

Una comparación de dos modelos temáticos dinámicos de vanguardia que resuelven el ejercicio de clasificación de quejas de los consumidores.

Fuente: foto libreImagen de rawpixel.com

Comentarios de clientes sobre productos y servicios proporcionan información valiosa sobre la satisfacción del cliente. Proporcionan información sobre lo que se debe mejorar en todo el desarrollo del producto. Los modelos temáticos dinámicos en inteligencia empresarial pueden identificar cualidades clave del producto y otros factores de satisfacción, agruparlos en categorías y evaluar cómo las decisiones comerciales se materializaron en la satisfacción del cliente a lo largo del tiempo. Esta es una información muy valiosa no sólo para los gerentes de producto.

Este artículo comparará dos de los últimos modelos temáticos para clasificar los datos de quejas de los clientes. BERTopic por Maarten Grootendorst (2022) y el reciente FASTópico por Xiaobao Wu et al. (2024) presentado en la edición del año pasado NeurIPSson los modelos líderes actuales para el análisis temático de datos de clientes. Para estos modelos, exploraremos en código Python:

  • cómo hacerlo efectivamente datos de preprocesamiento
  • cómo entrenar un Modelo de tema de Bigram para el análisis de quejas de los clientes
  • cómo modelar actividad temática con el tiempo.